云藏搜索引擎藏文信息处理数据标注
作者:才让本
来源:青海湖网
时间:2025-05-08 10:21:46
点击数:
云藏搜索引擎藏文信息处理数据标注
入选第八届数字中国建设峰会数据标注优秀案例
入选第八届数字中国建设峰会数据标注优秀案例
4月29日,第八届数字中国建设峰会“高质量数据集和数据标注主题交流活动”在福建省福州市举办,活动集中发布了全国47个数据标注优秀案例集名单,其中,由青海省数据局推荐的《云藏搜索引擎藏文信息处理数据标注》上榜优秀案例。
数据标注,是人工智能产业发展的先决条件。通过给文本、语音、图片、视频等各种各样的数据“打标签”,形成高质量的数据集,让机器“读得懂、学得快、训得好”。作为国内互联网藏文信息的主要来源和资源共享中心,“云藏”团队针对藏文信息处理面临语言结构复杂、标注标准缺失、数字化资源不足等问题,通过系统化数据标注技术,构建高质量藏文语料库,赋能藏文信息化行业,推动藏文自然语言处理技术的进步和实用化,促进地区信息化建设和数字经济的发展,也为藏文化的保护和传承提供了重要支持。
云藏搜索引擎藏文信息处理数据标注案例,在建立标准化标注体系、开发智能标注工具、构建开放协作生态、培养专业人才梯队、优化全流程管理方面取得了显著成效。协同业内专家,充分参与《信息处理用藏文分词规范》和《信息处理用藏语词类标记集》两项国家标准的制定,覆盖分词、词性、语义等维度;利用高质量人工分词标注语料基于机器学习研发藏文自动分词标注系统,分词准确率达95%以上,搜索准确率提升至97%,案例获青海省科技进步三等奖,获批青海省藏文信息技术科研科普基地;构建开放的数据标注平台,吸引13万实名用户参与,贡献10%的标注数据;联合高校开展藏文信息处理培训,柔性引进高端人才5人,支持11名从业人员攻读博士学位,缓解行业人才短缺问题;采用模块化设计,实现数据采集、标注、审核全流程数字化。
相关推荐
尼玛次仁:西藏文化是中国的也是世界的
6月29日下午,参加中国西藏文化保护与发展协会第二届会员代表大会的代表进行分组讨论。出席会议的西藏自治区人大副主任尼玛次仁慈眉善目、炯炯有神,流畅敏捷的谈话透出对西藏工作的熟悉与自信。讨论过程中,无论哪位代表发言,他总是亲切地注视着对方,西藏人特有的热情与...
2010-07-05 编辑:admin 10906共和三小缅怀革命先烈
4月2日,共和县第三小学组织全校师生开展“缅怀革命先烈”清明节扫墓及诗歌朗诵活动。 共和县第三小学全校师生清明节烈士陵园扫墓 共和县第三小学全校师生清明节烈士陵园扫墓 当日清晨,共和县第三小学少先队员从学校出发,排着整齐的队伍,怀着对革命先烈无...
2010-04-08 编辑:admin 15174《藏族少儿知识文库》(第四辑)近日正式出版发行
近日,《藏族少儿知识文库》(第四辑)由青海民族出版社正式出版发行。《藏族少儿知识文库》(第四辑)是“十四五”国家重点图书出版规划项目和民族文字出版专项资金资助项目之一,共有五本书。...
2023-12-28 编辑:索南多杰 7993甘孜重修世界最大室内铜铸释迦牟尼佛像
世界第一大室内铜铸的如来释加牟尼佛像主体工程在四川甘孜藏区长青春科尔寺基本完工。这座世界最大室内如来佛像总高度二十四米、宽十七米、厚达十米,位于四川甘孜藏族自治州理塘县长青春科尔寺。 由中国政府拨款和信教民众捐资共建的世界第一大室内铜铸如来释迦牟尼佛...
2008-11-13 编辑:admin 11431联系电话:0974-8512858
投稿邮箱:amdotibet@126.com
推荐
换一批