两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
{dede:pagebreak/}
如何评价仓颉编程语言7月30日开源?
服务器能否拒绝非浏览器发起的HTTP请求?
自己拥有一台服务器可以做哪些很酷的事情?
为什么任天堂在NS2上没有选择使用OLED屏幕以提升续航能力和显示效果?
jwt的设计合理吗?
如果苹果真的下架了微信的话,会发生什么?
为什么说纯铜是紫色的,可是我看上去更像纸箱子的颜色啊,是否我自己有色盲呢?
如何评价仓颉编程语言7月30日开源?
华为最令你动容的地方在哪里?
后端开发除了增删改查还有什么?
华为 HDC 发布 HarmonyOS 6 开发者 beta 版对应用开发者和鸿蒙生态有哪些影响?
VSCode 都有哪些牛逼的插件?
如何看待 Rust 的应用前景?
自己组一个E5服务器才几百块钱,为什么去阿里云租这么贵?
PHP初学者,我能不能使用PHP来开发桌面应用?
核聚变是一条死胡同吗?