【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
{dede:pagebreak/}
敢不敢留下一张自拍照让人打分?
JetBrains 放弃 AppCode 是否是一个错误决定?
如何评价仓颉编程语言7月30日开源?
如何看待湖北一医院婚检查出艾滋医生未告知伴侣致感染,医生被停职?反映出哪些问题?
如何评价黄磊?
Trae和Cursor对比有什么优势吗?
为什么中国电信的iptv一定要有网线连接!?
中国女明星里谁的身材特别好?
为什么国内的uni***一直没人讨论呢?
帝王蟹极度泛滥,严重影响生态平衡,但是为什么还那么贵?
请问27寸4K显示器哪个好呀?
为什么大部分游戏公司仍在坚持使用SVN?
税务总局新局长上任后,有什么新的变化吗?
作为独立开发者,有哪些可以分享的经验?
我听说Windows12微软就直接重头构建Windows了,就直接重构Win内核了,到底是不是真的?
有没有GUI框架开发难度小,***消耗又不多,而且又跨平台?