青海“云藏”打造全球首个藏文智能搜索引擎
“搜索引擎是文化与历史传承的新载体,对一国的文化安全意义重大,‘云藏’是全球首个藏文智能搜索引擎,建成后对藏文信息安全、国内外涉藏舆情监测以及重要舆情分析将提供可靠的参数和依据”。2日,青海省海南藏族自治州藏语委办主任、“云藏”引擎开发负责人才洛告诉中新社记者。
“云藏”一词是藏文的音译词,有两层含义,其一为“上师”或“老师”,意为有求必应、有问必答;其二是将其分为单字,有“全面抓取、提取”之意。“云藏”搜索引擎是青海省少数民族事业“十二五”规划中藏文信息化建设的重要组成部分,于2013年4月启动系统平台项目建设,研发团队现有100余名工作人员,由藏文信息录入组、分词标注组和技术组3个小组组成,团队中藏族比例达84%,该搜索引擎预计将于2015年年底建设完成,2016年7月正式开通。
“目前,中国国内如百度、搜狗等主要的搜索引擎中没有藏文搜索功能,但国外搜索引擎反而支持藏文的简单搜索,如谷歌英文版、中文版,雅虎英文版、中文版以及微软的bing搜索引擎等”,才洛说,“由于数据索引库在国外,检索到的信息准确性和内容有受制性,对应出自国内的真实和有效的信息不能被及时检索,提供的有关藏文化知识准确度不高、信息量不够”。
据了解,“云藏”藏文搜索引擎系统平台建设项目,是一个集搜索引擎、藏文百科、自动问答为一体的大型藏文门户系统工程,将开辟新闻、网页、图片、视频、百科、文库、知道7个板块,“任何搜索引擎中,数据库的建设是最为繁琐艰巨的工作。尤其对于藏文搜索引擎来说是一项从零开始的浩大工程”。才洛介绍,“云藏”搜索引擎覆盖了文化、卫生、教育、科技、宗教、人物等诸多方面,截至目前,已录入历史、文学、宗教、医学、自然以及各类词典等25类资料,共录入12.7万条词条,字数达1197.7万字。
“‘云藏’建成后,该系统的藏文搜索正确识别率将达95%,不仅能满足藏文网民个性化的检索需求,还将推动藏文信息全方位融入互联网世界。”才洛说,“未来使用藏文的网民输入一个词汇,就会有对应的百科知识,如果词条内容空缺,系统会提示网民自主添加,后台审核通过即可录入数据库,这种方式,将使数据库不断地丰富、扩充”。
目前已知的藏文网页超过6700万个,初步估算,“云藏”运行初期,青、藏、甘、川、滇五省区的藏文用户数量约为120万,随着搜索引擎产品的推广和宣传,用户量将达200万。
春节、藏历土鼠新年恰逢同一天 藏汉人民共庆新年
在举国同庆新春佳节的时候,雪域高原也迎来了最隆重的民俗节日——藏历土鼠新年,两大节日碰在同一天,使节日的西藏显得更加的喜庆和热闹。 初一一大早,藏族人家按照传统习俗给自家的门窗换上了崭新的“鲜布”,各种各样的吉祥图绘在自家门前,人人穿上节日的盛装,端着象征五谷...
2008-02-09 编辑:admin 6941西藏超三分之一土地被纳入自然保护区
珠峰自然保护区下的羊群 摄影:王昕秀 羌塘自然保护区是野生动物的乐园 摄影:王昕秀 日前,记者从西藏环境保护厅获悉,截止到2010年,西藏已建立各类自然保护区47个。保护区的总面积达41.37万平方公里,占西藏土地面积的34.47%,居全国首位。这表明,西藏有超过1/3的土地都被...
2010-11-17 编辑:admin 6083青海省曲艺专著《青海眉户》出版发行
由中共乐都县委宣传部选定课题,青海省作家协会会员周尚俊同志历时两年搜集整理撰写的地方曲艺专著《青海眉户》近日由青海人民出版社正式出版发行。 该书共收录有《藏舟》、《草坡传信》、《打沙锅》等传统青海眉户剧目60部,填补了青海眉户这一地方曲艺专著的空...
2010-04-03 编辑:admin 5198中央第七环境保护督察群众信访举报受理情况
中央第七环境保护督察组转交青海省第七批群众信访举报材料92件及边督边改情况 2017年8月16日上午10时10分,中央第七环境保护督察组转交青海省第七批群众信访举报材料共92件,其中涉及西宁市60件、海东市19件、海西州4件、海南州5件、海北州2件、果洛州1件、黄南州1件...
2017-08-18 编辑:admin 3452联系电话:0974-8512858
投稿邮箱:amdotibet@126.com