两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
{dede:pagebreak/}
三次元中真的存在二次元中的超长头发吗?
为什么家里要用 NAS?家用 NAS 有哪些实际的、接地气的用途?
程序员从幼稚到成熟的标志是什么?
为什么全世界无一人能实现新mac直接全功能稳定装Win 11 arm,或PC直接装macOS arm?
年近60的陈鹤皋的肌肉在格斗家中是什么水平?
我想做个小型的商业网站该用nodejs还是python做后端?
为什么全世界无一人能实现新mac直接全功能稳定装Win 11 arm,或PC直接装macOS arm?
前端开发现在主流的技术有哪些?
通过重体力劳动练出来的肌肉和标准健美人员肌肉有什么不同?
有哪些BI工具惊艳了你?
程序员从幼稚到成熟的标志是什么?
台湾是中国领土,那台湾海峡算是内海,为什么不击沉那些无理通过海峡的军事力量?
山西一职工「1 岁工作、22 岁退休」,冒领养老金 69 万,此事该如何追责?谁该赔偿财政损失?
如何一眼看出两个人私下里发生了秘密关系?
你们的腰椎间盘突出,怎么治好的?
现实中的父女关系是怎样的?