0.5b 这种才是最有用的,因为它可以万能地微调成单一小任务。
而且它参数量小,本地跑,运行快。
以前的那些nlp任务都可以用这种万金油来微调。
比如文章提取,文章样式整理,数据格式转换,文章校验,快递信息提取等。
你可能会说我为什么不用传统的nlp来干? 主要是现在的llm模型,从训练到部署已经非常的流水线了,不会深度学习的人也能训练一个并部署,这个流水线简单到,真的只需要处理数据集而已。
整个过程你甚至不需要写…。
{dede:pagebreak/}
如何看待某日本小学校园餐只有一小块鸡肉?
怎么评价国内AI企业人肉背15块80TB硬盘,飞去马来西亚用英伟达训练数据,以规避美国禁令?
为什么 Bun 选择了 Zig 以及 JSCore?
你最推荐 macOS 上哪款中文输入法?
你们在编程时遇到过什么离谱的bug吗?
如何评价高圆圆的身材算是美女类型的吗?
请问照片里这个人是谁呀?
如何反驳“电脑普及15年,年轻人还要淘宝代装steam”?
程序员明明是技术积累岗位,为什么年龄越大反而可替代性变高了?
亚洲体坛最漂亮的十位女运动员都有谁?
你为什么在日常生活中不敢穿的太漂亮?
你都见过什么样的电脑盲?
现在手里有一万闲钱,买什么币好?
为什么macOS软件生态不敌Windows?
如何评价***伊内斯·特洛奇亚的身材?
都说时尚是一个轮回,有哪些老电视剧里面的穿搭到现在都还是很潮的呢?