两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
{dede:pagebreak/}
为什么欧美影视喜欢露点?
如何低成本地过有益的生活?
日本制造的质量真的就那么好吗?
Vue性能优于React,那为什么还不用Vue?
你怎么看待剪映收费过高问题?
各位前端大触们,一般怎么定颜色的?
国内***购 5000 万台电脑,***用100% 国产芯和操作系统,意味着什么?
中国女性的臀围普遍比欧美女性小,是人种的差异吗?
前端 css 中的 Grid 属性有哪些?
男朋友说我穿衣服太开放,难道好身材不应该显示出来吗?
PVD就是电镀吗?
鸿蒙折叠屏笔记本为什么敢卖26999?
有人说x86是条必沉的船,苹果早就跳船了,微软也有弃船的意图,你怎么看?
流行的前端开源报表工具有哪些?适合在企业级应用的。
央行行长潘功胜首次在公开场合谈及稳定币,稳定币是什么?有何深意?
为何 Linus 一个人就能写出这么强的系统,中国却做不出来?