核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
{dede:pagebreak/}
实体店为什么生意越来越难做了?
如何看待小米SU7Ultra原型车2025年4月在纽北取得6分22秒091的好成绩?
为什么 J***aScript 在国外逐渐用于前端+后端开发,而国内还是只用它做前端?
如何评价Cursor?
如何评价最新发布的 vivo X Fold5,作为首款「三防」折叠屏手机,都有哪些亮点值得关注?
为什么美国程序员工作比中国程序员工作轻松、加班少?
为什么bilibili后端要用go来写?
作为一个服务器,node.js 是性能最高的吗?
如何看待小米 YU7 3 分钟大定突破 20 万辆,锁单 12.2 万辆?小米汽车做对了什么?
经济上行是什么样子的?
什么是人生的最顶级享受?
买电纸书的人为什么不直接用平板?
深圳的人口最终会剩下多少?
你觉得《捞女游戏》会因为不可抗力而被下架吗?
现在工作中k8s是使用containerd还是docker来管理容器?
为什么是 9 月 3 日阅兵而不是 10 月 1 日国庆阅兵?