核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
{dede:pagebreak/}
如何看LOL官方,把AL的冠军改成优胜者?
为什么 Windows 没有比较成熟的第三方桌面环境(explorer.exe)?
中年男人为什么还在玩十年前的游戏?
苹果为什么要给每代MacOS起个名字,真以为人们记得住分得清吗?
为什么人们通常不相信漂亮女孩是一个工程师?
你发生过的最尴尬的事是什么?
中国外交部及有关使领馆正迅速组织撤离在以、伊的中国公民,目前当地情况如何?
跟离异的女同事聊天时,她冒出一句:「你老婆还不如我,离了跟我过得了」,我该怎么回答?
人类为何不大规模训练猴子做「流水线工人」?
为什么女游泳运动员看起来大部分都是平胸?
中国女篮张子宇身高 2 米 26 制霸赛场,身高因素在篮球比赛中能占多大优势?她会是下一个「姚明」吗?
中国大陆的苹果手机被阉割了哪些部分?
5 月 28 日 DeepSeek R1 模型完成小版本试升级并开源,具体有哪些提升?使用体验如何?
2025年现在开发php项目选择lar***el框架好还是thinkphp框架好?
为什么 Windows 系统上的安装包有 exe 和 msi 两种格式,有什么区别?
蜂鸟音乐指控邓紫棋侵权,要求 48 小时内下架重录歌曲,邓紫棋回应「不会下架」,这一指控合理吗?