两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
{dede:pagebreak/}
生完孩子身材依旧火辣是一种怎样的体验?
你们跟网友面过基吗?翻车了吗?
有哪些是你用上了mac才知道的事?
为什么日本人口密度这么大还能住一户建,中国只能住楼房?
苹果为什么要给每代MacOS起个名字,真以为人们记得住分得清吗?
你亲身接触过的日本人的印象是怎样的?
Swift 和同时代的其他语言比起来怎么样?
如何评价《三角洲行动》***作者「三角洲经济学教父」?
据说go和c#的开发者都说自己比较节省内存,你们认为呢?
中国有能打到美国本土的导弹吗……有的话最远能打到哪里呢?
你见过最有远见的人是什么样的?
眼睛有飞蚊症可以自愈吗?
人类真的想象不出从来没见过的东西吗?
duckdb的性能如何?
为什么都对TLC乃至未来的QLC嗤之以鼻呢?
用J***a写Android的时代是不是要结束了?