3月24日,国新办举行介绍第九届数字中国建设峰会有关情况的新闻发布会。国家发展改革委党组成员、国家数据局局长刘烈宏介绍了国家数据局在推进高质量数据集赋能人工智能发展方面的工作情况。
他说,国家数据局高度重视数据要素赋能人工智能创新发展的工作,我们提出人工智能发展到哪里,我们就把高质量数据集建设到哪里。“人工智能+”行动到哪里,行业高质量数据集的建设和推广就要到哪里。
他介绍,我们针对高质量数据集建设“小和散”的问题,会同26个部门组织遴选了72家高质量数据集建设链主单位、140个先行先试工作单位和104个典型案例,构建了链主带动、多方参与、联合攻关、共建共享、合作共赢的高质量数据集建设生态,从而持续推动高质量数据集的建设。
为推动数据标注产业发展,我们布局了成都、沈阳、合肥、长沙、海口、保定、大同7个承担数据标注先行先试建设任务的城市,出台了《关于促进数据标注产业高质量发展的实施意见》,遴选出47个数据标注优秀案例,指导举办了7次数据标注的供需对接会。
他表示,下一步,我们将面向科技创新强、发展基础好、产业特色优的地区,聚焦“知识密集型”和“技术驱动型”这两个方向,梯次布局一批技术先进、特色鲜明、高效赋能的数据标注产业创新试验区。
我们还持续培育“为高质量数据付费”的市场共识,推动行业高质量数据集在数据交易所挂牌、上架、交易。支持数据流通服务平台、数据商等机构提供流通交易的服务,鼓励各类数据流通服务机构探索多样化的高质量数据集流通利用模式,推动高质量数据集供需有序对接,支持行业高质量数据集流动起来。
在各方共同努力下,高质量数据集的建设工作取得了阶段性的成效,截止到2025年年底,全国已建成的高质量数据集超过了10万个,总体量超过了890PB,这相当于中国国家图书馆数字资源总量的310倍左右。到今年3月,我国日均Token的调用量,也就是词元的调用量,已经超过了140万亿,相比2024年初的1000亿增长了1000多倍,相比2025年底的100万亿,三个月时间又增长了40%多。
他说,日均Token调用量的大量增加,充分表明中国的人工智能发展进入了快速增长阶段,应用场景在不断深化,从能对话到能决策执行的智能体,中国人工智能产业的竞争力也显著增强,现在大家热议的Token出海,就是产业竞争力增强的一个标志。当然从数据的维度来看,也标志着数据集的供给在大量增加,数据要素的价值在不断释放,数据要素赋能人工智能创新发展进入了良性互动的阶段。
刘烈宏表示,下一步,我们将持续推进数据赋能人工智能创新发展,协同各方深入实施新一轮的高质量数据集建设行动计划,包括强基扩容、标注攻坚、提质增效、应用赋能、管理服务、价值释放六大专项行动,以场景需求为牵引,加快推进先行先试的工作,打造技术可行、实用便捷、质量保障的AI-Ready高质量数据集,实现高质量数据集供给的量质提升。
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
消息称台积电在德新厂要求50亿欧元补贴,占总投资
,据彭博社消息,台积电正与德国政府进行激烈的争论,为其在德新建的...
税收大数据显示:中国建设统一大市场呈现“三强”态
中国正在建设高效规范、公平竞争、充分开放的全国统一大市场。国家税...
百度推出集成在手表的AI产品“小表AI”App,
,百度旗下的子公司小度近日推出了一款名为“小表AI”的产品,旨在...
徕卡Q3紧凑型全画幅相机发布:升级6000万像素
感谢IT之家网友雨雪载途、独立摄影师的线索投递!,今晚徕卡发布了...
责任照亮未来丨筑梦亚运,小排球教培项目启动
5月25日,中国太保在青海省共和县第二寄宿制小学,开展“责任照亮...
新房准备租出去怎么装修最省钱装修过程中8个容易省
导读大家好,小号哥来为大家解答以上问题什么颜色头发显白,显白的发...