短的结论:快有极限,Gemini没有 基本信息:Gemini 2.5 Lite成本:0.4美元每百万速度:约577字每秒平均长度:约7200字平均耗时: 11秒 Gemini 2.5 Lite(Think)成本:0.4美元每百万速度:约390字每秒平均长度:约1***00字平均耗时: 52秒 逻辑成绩: *表格为了突出对比关系,有一定裁剪,不是完整排序 **测试方式:参见 [文章: 大语言模型-逻辑能力横评 25-05 Update(Claude4/Qwen3/Gemini2.5Flash)] ***这次测试基于6月题目,已经增加#38、#3…。
{dede:pagebreak/}
什么是微软式中文?
超级喜欢穿短裙正常吗?
一个非常漂亮的残疾女孩,会有人愿意娶吗?
超小团队选择Django还是Flask?
《西西里美丽传说》女主角,在当时打扮这么高调,不觉得带给自己很多不便吗?如何理解她的心态?
认为意大利面比兰州拉面/苏式面/北京打卤面等要好吃的人,认为意大利面好吃在哪里?
《斗破苍穹》中韩枫这么多年为何只是斗皇?
为什么抖音上的姑娘都那么好看,现实中我怎么一个也见不着?
为什么朝鲜始终未解决粮食短缺问题?
为什么日本经济下降,大学排名跌至谷底,还有那么多人挤破脑袋去日本留学?
python与nodejs哪个性能高?
如何评价漫威剧《钢铁之心》?
上学要不要穿内衣?
做完截肢手术后切下来的废肢去哪了?
男子聚餐喝酒后冻死街头,法院表示「4位同事无过错」,如何评价此事?共同饮酒人是否需要承担责任?
为什么是 9 月 3 日阅兵而不是 10 月 1 日国庆阅兵?