短的结论:快有极限,Gemini没有 基本信息:Gemini 2.5 Lite成本:0.4美元每百万速度:约577字每秒平均长度:约7200字平均耗时: 11秒 Gemini 2.5 Lite(Think)成本:0.4美元每百万速度:约390字每秒平均长度:约1***00字平均耗时: 52秒 逻辑成绩: *表格为了突出对比关系,有一定裁剪,不是完整排序 **测试方式:参见 [文章: 大语言模型-逻辑能力横评 25-05 Update(Claude4/Qwen3/Gemini2.5Flash)] ***这次测试基于6月题目,已经增加#38、#3…。
{dede:pagebreak/}
如何看待《三角洲行动》中***配件不能赛保险这一行为?
做引体向上可能会诱发腰肌劳损吗?
以总理称已控制伊朗首都领空,领空被控制意味着什么?伊朗还可以通过空袭反击吗?
剧版《长安的荔枝》相较于原著改编得如何?
乡下的土鸡真的值100块钱吗?
56 岁白岩松踢球摔倒久不能起,他目前情况如何?踢球时需要注意什么?
为什么 m1 ***用大小核设计却没有 intel 的问题?
你卡过最厉害的bug是什么?
Vue性能优于React,那为什么还不用Vue?
56 岁白岩松踢球摔倒久不能起,他目前情况如何?踢球时需要注意什么?
你的亲戚提过什么过分的要求?
你卡过最厉害的bug是什么?
如何评价雷佳音、岳云鹏主演的电视剧《长安的荔枝》?
做好的flask项目怎么部署到服务器,使用公网ip可访问?
如何看待 Rust 的应用前景?
伊朗没有战斗机吗?为什么不起飞空中拼***?