汉语音节的一般结构

 

    汉语的文语转换语音合成软件中,其语料库设计,一般以音节/音素为单位,提取出各类音色、韵律等特征参数,进行语料库的设计,因此汉语音节在语音合成技术中,是十分关键的要素。
    汉语音节一般由声母、韵母和声调三部分组成。汉语普通话中有6000多个常用字,每个汉字是一个音节,如将同音字合一处理,则汉语中共有1332个有调音节,其中可以单念的有1268个。汉语中一般有五个声调,即阴平、阳平、上声、去声以及轻声。如果不考虑声调,则汉语中无调音节共有407个。每个汉字有四种音节结构:V、CV、VC1、CVC1。其中,C是除了[ng]以外的全部辅音;V是单元音或复合元音;C1是鼻辅音[n]或[ng]。C称为声母,V或VC1称为韵母。这就是汉语的“声-韵”结构。一个音节完整的结构框架,一般包含以下各段:
    1)无声段:这一段只有塞音和塞擦音才有。从发音上看,它是塞音和塞擦音的成阻和持阻的阶段。此段呈无声能,但它的存在对塞音、塞擦音的产生和感知是至关重要的。
    2)爆破段:这一段也是塞音和塞擦音所特有的。从发音上看,此时声道中的阻塞处突然打开。从频谱上看,这一段是一个时长很短的脉冲。
    3)摩擦和/或噪音段:这一段几乎对所有的声母都有意义。但对于不同的声母来说,此段的发音和声学特征会很不一样。从声源来看有两种,一种是噪声源,产生于气流急速通过声道某狭窄处时形成的湍流;另一种是噪音声源;它产生于气流通过声门时带动声带所作的准周期性运动。因此清声母在此段用的是噪声源;浊声母或者是用噪音声源(边音、鼻音),或者同时使用两种声源(浊擦音)。
    4)送气段:这一段是送气塞音、送气塞擦音所特有的。送气塞音和送气塞擦音在爆破之后,声带并不立即开始振动,而是在一段时间内连续让声门敞开,并让肺部气流快速流出,在声门以及声门之上的声道狭窄处摩擦产生湍流。
    5)过渡段:过渡段指的是处于声母和韵母之间,跟韵母共振峰平滑衔接的一段高度动态性的浊音音段。但同时音渡不仅包括过渡段,同时还包括送气段(在送气辅音中),而音渡对于许多辅音的感知起着决定性的作用,所以它同属于声母和韵母。
    6)起始目标值:这段是韵母的第一段,也叫“韵首”。只有当韵母里含有2个或3个音位,才有[i]、[u]、[y]这3个“韵首”,又被称为介音。介音发音时开口度较小,所以F1较低,总能量较弱,而且它具有过渡性,是一个不稳定阶段。
    7)核心目标值:这一段是绝大多数音节的核心部分,具有典型的频谱模式。
    8)收尾目标值或后音渡:当韵母为三合谱时,这一段大致相当于普通话语言学中的元音性韵尾。它的声学表现同主要元音相似,只是它的目标值往往不易达到。后音渡的性质和前音渡非常相似,只是它的时长要比前音渡加倍。
    9)鼻尾段。鼻韵尾是普通话里唯一能出现在音节末尾的辅音。它们的特性与声母里的鼻辅音基本相同,不过鼻韵尾有时仅仅表现为对主要元音的鼻化,而不表现为鼻辅音。
 
    相关链接


2010-04-23
    北京宇音天下科技有限公司-国内中文语音合成芯片研发单位,旗下的产品有OSYNO6188语音合成芯片、SYN6288语音合成芯片、emTTS语音合成软件、嵌入式笔画王输入法等。公司的产品主要是致力于车载电子、安防监控、品牌防伪、智能仪表、智能通信、门禁考勤等各行各业中的智能人机语音交互应用。并向这些行业内各公司、企业相关的研究、采购、管理决策人员,提供嵌入式中文语音合成芯片或中文TTS芯片、以及嵌入式语音合成软件/中文TTS软件、还有语音芯片等相关的、语音信号处理领域的专题普及知识,为他们的产品选型、研发决策提供权威的参考依据。