PSOLA算法合成语音方法

 

    20世纪80年代末提出的PSOLA合成技术(基音同步叠加技术)给波形拼接合成技术注入了新的活力。PSOLA技术着眼于对语音信号超时段特征的控制,如基频、时长、音强等的控制。而这些参数对于语音的韵律控制以及修改是至关重要的,因此,PSOLA技术比LPC技术具有可修改性更强的优点,可以合成出高自然度的语音。
    PSOLA技术的主要特点是:在拼接语音波形片断之前,首先根据上下文的要求,用PSOLA算法对拼接单元的韵律特征进行调整,使合成波形既保持了原始发音的主要音段特征,又能使拼接单元的韵律特征符合上下文的要求,从而获得很高的清晰度和自然度。
    PSOLA技术保持了传统波形拼接技术的优点,简单直观,运算量小,而且还能方便地控制语音信号的韵律参数,具有合成自然连续语流的条件,得到了广泛的应用。
    但是,PSOLA技术也有其缺点。首先,PSOLA技术是一种基音同步的语音分析/合成技术,首先需要准确的基因周期以及对其起始点的判定。基音周期或其起始点的判定误差将会影响PSOLA技术的效果。其次,PSOLA技术是一种简单的波形映射拼接合成,这种拼接是否能够保持平稳过渡以及它对频域参数有什么影响等并没有得到解决,因此,在合成时会产生不理想的结果。
 
    相关链接:


2010-04-13
    北京宇音天下科技有限公司-国内中文语音合成芯片研发单位,旗下的产品有OSYNO6188语音合成芯片、SYN6288语音合成芯片、emTTS语音合成软件、嵌入式笔画王输入法等。公司的产品主要是致力于车载电子、安防监控、品牌防伪、智能仪表、智能通信、门禁考勤等各行各业中的智能人机语音交互应用。并向这些行业内各公司、企业相关的研究、采购、管理决策人员,提供嵌入式中文语音合成芯片或中文TTS芯片、以及嵌入式语音合成软件/中文TTS软件、还有语音芯片等相关的、语音信号处理领域的专题普及知识,为他们的产品选型、研发决策提供权威的参考依据。