核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
{dede:pagebreak/}
如何评价字节跳动开源的 HTTP 框架 Hertz ?
中国的核武库规模为什么那么小?
如何评价MiniMax推出的全球首个开源大规模混合架构的推理模型MiniMax-M1,其有何技术优势?
我国004号航母什么时候下水?
如何评价华为鸿蒙电脑?
为什么中国航天不像NASA那样展示更多的宇宙景象?
为什么软件公司很少用python开发web?
陌生人晕倒了,帮他拨打120后,病人不支付120出车费,这个费用谁来承担?
怎么样才能让大模型的RAG迅速落地?
马斯克宣布已激活了「星链」卫星通信系统,该系统现已在伊朗投入使用,这将对伊朗的互联网监管带来哪些影响?
女明星做了什么医美项目保持童颜?
为什么苹果手机杀后台现象频繁?是内存不够、后台管理严格还是其他原因呢?
如何评价阿里等大厂笔试现已经禁用本地IDE?
手机的运行内存真的有必要上16GB吗?
Chrome 浏览器设计的神细节有哪些?
5挺马克沁机枪,能否击败50万重骑兵?