贵州日报天眼新闻记者 鲍贝贝
“引入词元技术后,我们算法模型的响应速度、准确性及资源消耗均实现了可量化的显著提升。”5月6日,贵阳市高新区,大数据国家工程研究中心(中电科大数据研究院)技术专家周维一边展示最新的测试数据报告,一边解读词元技术为相关项目带来的成本节约与效率提升情况。
人工智能技术快速演进,“词元经济”已悄然兴起。大数据国家工程研究中心率先在中医药、电力等重点行业高质量数据集建设中引入这一技术,通过对专业知识、业务规则及多源异构数据进行“词元化”拆解与标准化治理,统一了跨行业的语义表达体系。
“以贵州特色中医药多场景智能应用项目为例,我们搭建了专属的中医药词元知识库,统一了古籍、临床、种植、质控等异构数据语义。”周维介绍,传统中医药数据零散、语义不统一,难以形成全链条的数据联动,他们围绕天麻、八爪金龙等本地道地药材与民族经典方剂资源,搭建起了专属中医药领域的词元知识库。
这统一了古籍文献、临床诊疗、田间种植、加工质控等异构数据的语义表达,还依托词元的语义关联能力,实现了辨证分型、经典方剂智能推荐等功能。同时,通过词元化建模,团队可以精准输出产地适宜性评价、标准化种植规程及生长风险预警,打通了从药材源头种植到临床方剂应用的全链条数据联动。
周维介绍,词元技术的运用,为海量数据处理、大模型训练推理环节带来了可量化的效能提升,实现了速度、精度、资源消耗三重优化——
“模型推理整体响应耗时缩短30%至45%,批量海量数据处理效率提升20%以上;
“模型对行业专业信息的识别与推理准确率提升25%以上,专业场景下错误输出率下降35%;
“在资源消耗方面,同等数据量下的存储占用降低20%至30%,综合运行能耗与服务器资源开销降低约28%。”
“词元作为‘算力货币’,将成为智能时代可计量、可定价、可交易的核心价值锚点。”周维表示,大数据国家工程研究中心将以词元技术为核心引擎,深度聚焦中医药、民族医药等特色领域,系统性开展场景化高质量数据集建设,持续完善标准化中医药专属词元库,全面推动要素流通市场化,筑牢高质量数据供给底座。



