两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
{dede:pagebreak/}
如何评价小米 6 月 26 日发布的小米 YU7、MIX Flip2、REDMI K80 至尊版?
你们是怎样看待警察这一职业的?
小区车位10万一个,租的话一个月300元,还有必要买车位吗?
2025年六月现在硬盘咋还涨价了呢?
那你说什么样的是美女?
为什么要学go语言,golang的优势有哪些?
这位***叫什么啊?
为什么美国程序员工作比中国程序员工作轻松、加班少?
超小团队选择Django还是Flask?
为什么CCTV-6总是能播一些连院线都上不了的电影?
公司就一个后端一个前端,有必要搞微服务吗?
前端开发现在主流的技术有哪些?
男朋友说我穿衣服太开放,难道好身材不应该显示出来吗?
韩国作为发达国家,到底发达在哪?
你是在什么时候认识到自己好看的?
近期的舆论***中舆论几乎全部无用,是否可以说舆论已经失效?舆论无用?