数据标注,正迎来关键时刻。
1月13日,国家发展改革委、国家数据局、财政部、人力资源社会保障部联合印发《关于促进数据标注产业高质量发展的实施意见》(以下简称《实施意见》)。
其中提出,到2027年,我国数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%。培育一批具有影响力的科技型数据标注企业,打造一批产学研用联动的创新载体,建设一批成效明显、特色鲜明的数据标注基地,形成相对完善的数据标注产业生态。
政策持续利好
数据标注,也被称为数据标定、数据注释,是指对文本、图像、语音、视频等待标注数据进行归类、整理、编辑、纠错、标记和批注等操作,为机器学习和人工智能算法提供训练样本。
大模型时代,AI开发以数据为核心,数据的多寡与质量直接关系到大模型的智能水平。数据标注作为人工智能产业和数据产业发展的基础核心环节,对构筑我国人工智能发展的数据先发优势具有重要意义。
国家数据局在2024年全国首次数据工作会议上,就已经提出探索建设国家级数据标注基地,在数据标注产业的生态构建、能力提升和场景应用等方面先行先试,集聚龙头企业,打造区域人工智能产业生态。5月,经过国家数据局综合评估,四川省成都市、辽宁省沈阳市、安徽省合肥市、湖南省长沙市、海南省海口市、河北省保定市、山西省大同市共7座城市成为首批全国数据标注试点基地。
分析人士认为,作为国家级别的项目,政策上的大力支持和资源上的优先配置,将为数据标注行业的发展提供有力保障。同时,这也将引发社会对数据标注行业的更多关注和认可,提高行业的整体形象和地位,同时也会释放出大量的相关订单。
2024年10月,由国家数据局数字科技和基础设施建设司指导,国家数据局人工智能专班主办的首届“数据标注产业大会暨供需对接会”在北京召开。此次大会旨在推动数据标注产业高质量发展,促进数据标注基地快速形成面向产业的规模化服务能力。
现场,成都、沈阳、合肥、长沙、海口、保定、大同7个城市数据标注基地进行了招引推介,促成了数据标注基地和33家企业的合作签约。其中,位居成都新津区的成都数据标注基地牧山园区,拿下7项合作,占据成都签约项目八成以上,成为本次数据标注产业大会达成合作最多的标注基地。
据了解,成都为推动数据标注试点城市建设,作出了“一个牵引区+三个聚集区”的生产力布局。成都数据标注基地牧山园区,位于成都新津区东北部的天府牧山数字新城,距离双流国际机场10余公里,紧邻成都地铁10号线,拥有10万平米产业载体,可用于数据标注及上下游企业入驻,是成都最具发展潜力和显示度的数据标注产业聚集区之一。
《实施意见》提出,培育一批数据标注龙头企业,鼓励通过资源整合、并购重组等方式做大做强,推动数据标注企业规模化、标准化、集约化发展。支持和鼓励科技创新型数据标注企业承担基础研究、技术攻关、产业应用等重点任务,提高产业链协同创新水平。培育一批深耕行业的数据标注瞪羚企业、独角兽企业。推动数据标注中小企业与人力资源、金融服务、合规咨询等第三方机构精准对接,助力企业快速发展。
各路巨头加持
在AI应用需求飞速提升的背景下,各路巨头也开始加速对数据标注产品的研发和推出。
2024年9月,蚂蚁数科发布新一代数据标注产品,向企业客户提供AI驱动的全流程数据服务。蚂蚁数科具备领先的AI算法,在标注产品中配置了模块化服务和算法调度能力,能够在高效匹配“人和任务”的前提下降低标注的复杂度,帮助用户解决通用大模型、多模态大模型和行业垂类大模型的数据标注需求。据悉,该产品可以覆盖多行业场景文本、图像、音频、视频标注需求。
10月,由青海国投所属青数集团参与建设的百度智能云(海东市)人工智能基础数据产业基地在海东市互助县正式启动。据悉,该基地是青数集团携手百度智能云及互助县政府共同打造的数据要素产业重要成果,旨在全力推动海东市数据标注产业集群快速发展,为全省人工智能产业生态建设树立“海东样板”,提高市场竞争力。
A股上市公司也在加速对数据标注领域的布局。12月3日,中达安在互动平台表示,公司子公司山东中达安智算数据科技有限公司的业务有涉及数据标注的业务,其位于国家超算济南中心园区内的基地于日前揭牌。
海天瑞声则在早期的一份机构调研中称,第四代智能驾驶标注平台,将可支持智能驾驶全应用场景、各类型传感器及多传感器融合的数据处理;此外,公司基于对智能驾驶感知算法趋势研判,进行了标注工具升级,平台将可支持行业各类前沿标注需求,包括连续帧融合标注中3D点云polyline、freespace的标注、BEV(鸟瞰图)标注、4D点云叠加标注等热点功能,具有竞争力的平台将成为公司业务拓充的核心动力。
据其介绍,第四代智能驾驶标注平台将继续发力算法建设,通过提升2D视觉及3D点云连续帧标注中的插值、预测、自动贴合、地面检测等算法效果,提高数据标注效率,降低标注成本。
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;
2.本站的原创文章,欢迎转载,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;
3.作者投稿可能会经我们编辑修改或补充。