0.5b 这种才是最有用的,因为它可以万能地微调成单一小任务。
而且它参数量小,本地跑,运行快。
以前的那些nlp任务都可以用这种万金油来微调。
比如文章提取,文章样式整理,数据格式转换,文章校验,快递信息提取等。
你可能会说我为什么不用传统的nlp来干? 主要是现在的llm模型,从训练到部署已经非常的流水线了,不会深度学习的人也能训练一个并部署,这个流水线简单到,真的只需要处理数据集而已。
整个过程你甚至不需要写…。
{dede:pagebreak/}
如何反驳“电脑普及15年,年轻人还要淘宝代装steam”?
能分享一下你写过的rust项目吗?
为什么Go仅仅160MB的安装包就可以编译程序,而Rust却还需要几个GB的VC++才能编译?
周杰伦为什么不告粥饼伦黑伦侵犯他的名誉权?
为什么都认为无GC语言一定会比有GC语言要快?
华为自研的仓颉编程语言将于 7 月 30 日开源,这款语言将如何影响未来的开发趋势?
为什么bilibili后端要用go来写?
你最推荐 macOS 上哪款中文输入法?
老公没上进心,所以就骂了老公是废物,窝囊废,他很生气。怎么办?
网传前小米总监冯德兵婚内出轨,200 多份「包养合同」,这是真的吗?具体是怎么回事?
非计算机专业,好奇为什么会出现“程序依赖bug运行”的情况?
如何从零开始开发一款独立游戏?
雷军回应小米YU7价格,否认YU7标准版比SU7标准版贵两万到三万,科学分析下,YU7售价可能是多少?
上海的你,择偶的标准是怎样的?
你会从mac转向Windows吗?
下载的4k电影没有b站的4k清晰,是什么情况啊?