本报讯(记者 何欣)8月28日下午,2025数博会高质量数据集主题交流活动在贵阳国际生态会议中心举行。
活动由国家数据局主办,中国信息通信研究院、中国移动集团共同承办,以“数据要素赋能人工智能创新发展”为主题,邀请参与高质量数据集建设的高校、企业、行业机构等相关单位,系统总结高质量数据集建设方法,集中展示高质量数据集建设最新成果。
在主旨演讲环节,中国工程院院士吴世忠以《对大模型数据集建设的几点思考》为题,从重要意义、现实挑战、治理建议等方面作了深入浅出的报告。
活动现场启动了高质量数据集建设先行先试工作,发布了一批高质量数据集典型案例,指导有关单位发布《高质量数据集建设指引》等成果。
中国信息通信研究院、中国移动通信集团有限公司、中国电子科技集团有限公司、中国石油天然气集团有限公司等行业机构、企业还共同启动了高质量数据集领航计划,标志着各方在数据要素生态建设与高质量数据集供给方面迈出了关键的一步,为培育新质生产力、构建高质量数字经济基础设施奠定坚实基础。
北京银河通用机器人有限公司在活动中发布了高质量合成数据集驱动的具身VLA大模型及开源数据。“该数据集专为具身智能机器人灵巧抓取任务设计,适用于多指灵巧手(如ShadowHand)在高自由度操作场景下的模型训练与算法验证。”北京大学助理教授、银河通用创始人及首席技术官、智源学者王鹤介绍,该数据集包含超过132万条高质量抓取姿态,覆盖5355个物体,每个物体平均提供200多种多样化的抓取方式。可广泛应用于商超零售、工业分拣、家庭服务、医疗康养等实际场景,帮助人形机器人实现对外形不规则或需精细操作物体的稳定、多样化抓取,提升复杂环境下的操作适应性与任务成功率。
在主题报告环节,清华大学数字政府与治理研究院院长、教授张小劲,中国移动通信集团数智化部党委委员、副总经理陶涛,中科闻歌联合创始人兼首席执行官罗引,数据堂公司董事长、CEO齐红威四位嘉宾围绕高质量数据集建设工作各抒己见。
与会人员认为,数据资源非常重要,希望各行各业在推动行业大模型的应用过程中,加大对数据资源的投入,强化数据要素的价值认同,加快价值共创。



