宇音天下-作为专业语音合成芯片、语音合成软件及语音合成技术的提供商，为您解析语音芯片存储语音数据的常用压缩格式

语音芯片存储语音数据的常用压缩格式

（1）PCM格式： Pulse Code Modulation 脉冲编码调制，它将声音模拟信号采样后得到量化后的语音数据，是最基本最原始的一种语音格式。同它极为类似的还有RAW格式和SND格式。它们都是纯语音格式。

国内一些中文TTS芯片，或语音合成芯片，生成的合成语音，就是采用PCM格式的中间暂存结果，给客户进行

（2）WAV格式：Wave Audio Files 是微软公司开发的一种声音文件格式，也叫波形声音文件，被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法，支持多种音频位数、采样频率和声道，但WAV格式对存储空间需求太大不便于交流和传播。WAV文件里面存放的每一块数据都有自己独立的标识，通过这些标识可以告诉用户究竟这是什么数据，这些数据包括采样频率和位数，单声道(mono)还是立体声(stero)等。

许多语音合成软件或语音合成芯片，也会将合成语音暂存为WAV格式，输出到扬声器上。

（3）ADPCM格式：是利用对过去的几个抽样值来预测当前输入的样值，并使其具有自适应的预测功能与实际检测值进行比较，随时对测得的差值自动进行量化级差的处理，使之始终保持与信号同步变化。它适用于语音变化率适中的情况，而且声音回放过程简短。它的优点是对于人声的处理比较逼真，一般达到90％以上，已广泛地应用于电话通信领域。

也有些中文语音合成芯片和语音合成软件，可以生成ADPCM格式的语音数据格式，供用户再编辑使用。

（4）MP3格式： Moving Picture Experts Group Audio Layer III，简称为MP3。它是利用 MPEG Audio Layer 3 的技术，采取了名为“感官编码技术”的编码算法：编码时先对音频文件进行频谱分析，然后用过滤器滤掉噪音电平，接着通过量化的方式将剩下的每一位打散排列，最后形成具有较高压缩比的mp3文件，并使压缩后的文件在回放时能够达到较接近原音源的声音效果。它的实质是vbr（Variant Bitrate 可变波特率）可以根据编码的内容动态地选择合适的波特率，因此编码的结果是在保证了音质的同时又照顾了文件的大小。

mp3压缩率10倍甚至12倍。是最初出现的一种高压缩率的语音格式。

（5）Linear Scale格式：根据声音的变化率大小，把声音分成若干段，对每段用线性比例进行压缩，但是它的比例是可变的。SUNLINK公司和ALPHA公司的Linear Scale格式为5bit。

（6）Logpcm格式：基本上对整个声音进行线性压缩，将最后若干位去掉。这种压缩方式在硬件上很容易实现，但音质比Linear Scale差一些，特别是音量较小声音比较细腻的情况下效果较差。主要用于pure speech方面。

相关链接：

1、语音芯片/语音IC/Voice IC的定义

2、语音合成芯片或中文TTS芯片的定义

3、语音合成芯片与语音芯片的主要区别

4、语音芯片与语音合成芯片的关系

5、语音合成芯片与OTP语音IC组合具有的功效

6、语音合成方法的主要分类

7、线性预测(LPC)参数合成法

2010-04-13

北京宇音天下科技有限公司-国内中文语音合成芯片研发单位,旗下的产品有OSYNO6188语音合成芯片、SYN6288语音合成芯片、emTTS语音合成软件、嵌入式笔画王输入法等。公司的产品主要是致力于车载电子、安防监控、品牌防伪、智能仪表、智能通信、门禁考勤等各行各业中的智能人机语音交互应用。并向这些行业内各公司、企业相关的研究、采购、管理决策人员，提供嵌入式中文语音合成芯片或中文TTS芯片、以及嵌入式语音合成软件/中文TTS软件、还有语音芯片等相关的、语音信号处理领域的专题普及知识，为他们的产品选型、研发决策提供权威的参考依据。