格萨尔:说唱语音研究

作者:课题组供稿 来源:玛域格萨尔网 时间:2017-12-26 16:27:00 点击数:

  一、 研究进展情况

  1、课题开题与子课题进展情况

  研究计划顺利执行,各子课题取得进展。

  2016年4月1日,“《格萨尔》说唱语音的自动识别与格萨尔学的创新发展”项目启动暨专家咨询会在西藏大学召开。来自西藏本地和北京的7位专家在认真听取项目总体情况和研究方案优化情况,以及各个子课题的汇报情况后,纷纷发表意见,提出建议,充分肯定并高度评价《格萨尔》项目,给予项目组成员以极大的帮助和鼓励。各子课题分别消化吸收了专家咨询会上各位专家的意见建议。项目首席专家召开了子课题负责人第一次例会,各子课题负责人分别汇报了修订完善后的研究方案和研究计划,并进行了相关任务的对接。一年多来,各子课题均取得了基础性的进展:

  子课题一“基于文献计量分析的《格萨尔》研究历史、现状和趋势”。一是定制专门的文献计量分析软件工具,包括基于文献计量学方法的论文形式和关键词内容分析工具研发,以及基于词向量的短文本分析技术的文献内容挖掘工具研发,已经运用其他领域的数据集进行了多次测试和优化,很快即可在本项目应用;二是筛选《格萨尔》研究的学术文献,尤其是藏文文献,已经选出187篇藏文研究论文。

  子课题二“《格萨尔》说唱语音的声学和韵律建模及音字转换研究”。一是录制了斯塔多吉说唱本4部,计200多个小时;二是对多语言言语识别方法开展了相关研究,提出了基于多尺度特征的语音识别建模方法、基于参数共享神经网络的双语语音识别建模方法;三是基于言语中的多层次线索,对融合发音姿态信息的深层神经网络语音识别建模方法进行了探索;四是提出了基于深层循环条件随机场的中文自动分词方法并对藏语的分词和注音进行了探索,实现了藏文分词以及藏语方言国际音标转换的系统。

  子课题三“《格萨尔》的多媒体数据库及文本自动标引和知识检索系统”。一是建立了54049词条的藏语短语词条库和133226词条的藏语词语库,为藏文连续文本的切分提供了依据,并对藏文虚词的自动识别方法和技术进行了探索;二是结合子课题一的“短文本分析技术”和子课题二的“基于深层循环条件随机场的中文自动分词方法”,设计并初步论证了中文文献内容的自动标引和检索的技术路线。

  子课题四“基于《格萨尔》知识图谱的格萨尔学创新发展”。一是在分析格萨尔学的成长特征和成长空间的基础上,从情报学的多个视角探讨了格萨尔学的多方面成长机制,为前面三个子课题的研究目标实现提供进一步的参考;二是在西藏大学组建了“格萨尔史诗研究科研创新团队”。

  2、调查研究及学术交流情况

  调查研究工作主要是对非在线的藏文有关文献的调查筛选、《格萨尔学集成》(5卷)等早期文献的复制、在线中英文有关文献的抓取等。学术交流还仅限于项目组内部,等基础性研究更加充分并在说唱语音自动识别有重大突破后再进行国内外学术交流活动。

  3、成果推介与宣传

  成果宣传推荐方面,报送了两期《工作简报》,因尚处基础研究阶段,还没有举行成果发布会、没有向国家社科基金专刊投稿。

  二、 研究成果情况

  代表性成果:实现了藏文分词以及藏文文本到藏语方言国际音标转换的系统。

  要实现藏语方言语音的识别和分析,需要以国际音标IPA的形式分析藏文文本到藏语方言的发音,构建不同藏文方言由文本到发音的转换对照表。该系统由藏文文本分词系统和藏语方言国际音标转换系统两个子系统构成,后者又包括藏文词汇国际音标转换系统和藏文单音节方言国际音标转换系统两个部分。

  藏语在书面语上是统一的,即藏语方言在书写形式上是一样的。藏语主要划分为卫藏、康以及安多三大方言。不同的藏语方言在语音上体现在多个方面,主要特性包括:方言是否有声调、是否有清浊声母的对立以及辅音韵尾是否多寡。首先,基于《格西曲扎藏文辞典》中的藏文词汇,经人工整理、挑选和校对,最终获得七万五千条藏文词汇的电子词典。分词词典的每条词汇都包含藏文、对应的中文、部分词汇带有词性以及对应的拉丁形式。基于格助词添接法,将词典中的名词等转换为对应格的形式,然后将名词的格形式作为词典词条进行词典的扩充,最后在分词时使用扩充后的词典,实现对紧缩词的识别。其次,基于对藏文三大方言六大话系的分析,归纳出了拉萨、日喀则、德格、巴塘、泽库和拉卜楞等六个话系的藏文文本到国际音标的声母、韵母以及声调的转换对照表。

  该系统的实现,将有力地推进针对斯塔多吉说唱语音的自动识别和音字转换的研究工作。

相关推荐
  • 玉树州各族各界举行灾后恢复重建动员大会

      5月12日,为动员灾区各族、各界积极投身灾后恢复重建和社会主义新玉树建设,玉树州灾后恢复重建动员大会在州体育场举行。州委各部门、州直各机关单位、省驻玉树单位、解放军武警官兵、教育、卫生、宗教人士、各族群众和来自四面八方的援建队伍近万人参加。副省长、省...

    2010-05-13 编辑:admin 6803
  • 古格遗址洞窟惊现珍贵古藏文历史文献

    中国民族史学会副会长、西藏社会科学院研究员、著名藏学家巴桑旺堆日前向记者透露,西藏阿里地区札达县一座古格城堡遗址的废弃洞窟中惊现珍贵的古藏文历史文献残卷,经鉴定,此文书具有极大的学术研究价值。   巴桑旺堆说,2011年8月,当地一名僧人爬上位于札达县城附近古...

    2012-08-20 编辑:admin 11295
  • 海南州千名双语干部下乡宣讲藏区经济社会发展政策

    近日,青海省海南藏族自治州召开千名干部下乡宣讲中央和省委1号文件动员培训大会。会上,讲解了中央和省委1号文件精神、国家支持青海等省藏区经济社会发展政策的主要精神。要求下乡干部在宣讲工作中必须做到“一个讲清楚”、“四个必须掌握”、“三个落实到位”和“坚持六...

    2009-02-19 编辑:admin 5219
  • 云藏藏文搜索引擎系统平台用户社会调查问卷

      云藏搜索引擎系统平台是云藏藏文信息技术有限公司为推出的一款综合性的网络搜索引擎,自运营以来得到广大网友的大力支持和关注,在未来的发展中公司将进一步优化平台性能,依靠海量数据信息为广大网友提供更符合大家期望的服务和产品,感谢大家一如既往的支持和鼓励,请陪...

    2018-06-28 编辑:admin 7845