关于双英
現在位置: 首页关于双英行业新闻

中国的大规模AI模型,训练用的中文数据使用率超过60%

人民网日本语版 2025年08月19日 15:29


根据国家数据局的报告,在中国的大规模AI(人工智能)模型的训练性能提升中,中文数据发挥了重要作用。在中国的大多数大规模AI模型训练中,使用的中文数据比例超过60%,其中一些模型甚至达到了80%。中文高质量数据的开发能力和供应能力持续提升,推动了中国AI模型的快速性能提升。人民日报报道。


在AI时代,“token”指的是处理文本的最小单位。该局局长刘烈宏表示,“2024年初,中国每日token消耗量为1000亿,而到今年6月底,已经突破30兆,仅在一年半的时间里增长了300倍以上。这表明中国AI应用规模的快速增长。”(编辑KS)


人民网日本语版 2025年08月19日