文语转换系统原理和基本框图

 

    文语转换(Text To Speech)系统,是指把文本文件通过一定的硬软件转换后,由计算机或嵌入式计算系统输出语音的过程,并尽量使合成的语音系统具有良好的自然度与可懂度。文本转语音实际上可以看作是一个人工智能系统。为了合成出高质量的语言,除了依赖于各种规则,包括语义学规则、词汇规则、语音学规则外,还必须对文字的内容有很好的理解,这也涉及到自然语言理解的问题。下图显示了一个完整的文语转换系统示意图。
    文语转换过程是先将文字序列转换成音韵序列,再由系统根据音韵序列生成语音波形。其中第一步涉及语言学处理,例如分词、字音转换等,以及一整套有效的韵律控制规则;第二步需要先进的语音合成技术,能按要求实时合成出高质量的语音流。因此一般说来,文语转换系统都需要一套复杂的文字序列到音素序列的转换程序,也就是说,文语转换系统不仅要应用数字信号处理技术,而且必须有大量的语言学知识的支持。
    常见的语音合成软件中有关TTS功能模块的基本结构包括:
    (1)语言学处理
    在文语转换系统中起着重要的作用,主要模拟人对自然语言的理解过程——文本规整、词的切分、语法分析和语义分析,使计算机对输入的文本能完全理解,并给出后两部分所需要的各种发音提示。这部分需要语言数据库的支持。
    (2)韵律处理
    为合成语音规划出音段特征,如音高、音长和音强等,使合成语音能正确表达语意,听起来更加自然,以正确模仿人们在念读文本时的声调、语气、停顿方式、发音长短等韵律特征。
    较早期的韵律控制方法,均采用规则的方法,目前通过神经网络或统计驱动的方法进行韵律处理,已经获得了成功的应用。
    (3)声学处理模块
    根据前两部分处理结果的要求输出语音,即合成语音。目前解决这些问题较好的途径是,把基于规则的波形拼接技术和参数语音合成方法结合起来。
 
              
 
    相关链接:


2010-04-13
    北京宇音天下科技有限公司-国内中文语音合成芯片研发单位,旗下的产品有OSYNO6188语音合成芯片、SYN6288语音合成芯片、emTTS语音合成软件、嵌入式笔画王输入法等。公司的产品主要是致力于车载电子、安防监控、品牌防伪、智能仪表、智能通信、门禁考勤等各行各业中的智能人机语音交互应用。并向这些行业内各公司、企业相关的研究、采购、管理决策人员,提供嵌入式中文语音合成芯片或中文TTS芯片、以及嵌入式语音合成软件/中文TTS软件、还有语音芯片等相关的、语音信号处理领域的专题普及知识,为他们的产品选型、研发决策提供权威的参考依据。