首页 >> 产品中心 >> 语音合成语料库

语音合成语料库一站式解决方案


专业专注于语音合成技术领域,语音合成语料库从录音到数据质量严格把控,专业级品质。

  • 录音文本设计:平衡文本设计、覆盖率设计、工具开发,软件设计和开发;
  • 语音数据采集:中文专业发音人的遴选和评估、录音过程组织协调、项目管理与控制等;
  • 语音数据标注:标注工具软件的开发、多层级语音数据标注(音节音素切分与标注、多层次韵律标注,字/词边界标注);

提供从录音文本设计、覆盖率设计、数据采集、标注规范、标注图片在内的一站式数据定制解决方案
,帮助我们的客户在自然语言处理、机器学习等人工智能领域取得技术进步和市场突破。录音语料由文字、短语、句子组成,语料人工复检,准确 度高。适用于人工智能、智能家居、智能车载系统、智能安防等领域。

标注图片
:  

 
语音合成语料库-总体介绍

我公司现有语料库包括:

  • 纯中文语音合成库  :提供6女2男
  • 纯英文语音合成库  :提供2女1男
  • 中英混合语音合成库:提供2女
平均每句语料包含12字,部分可作为产品库,部分可作为试验库

中文女声晓玲语料库-详细介绍

中文语音合成语料库-女声晓玲:

•  国家一级播音员, 语音甜美
• 
专业录音棚录音
• 
时长15小时左右


标注规范:
• 
合成语音数据的音节音素切分与标注
• 
重音与多层次韵律标注
• 字/词边界标注
• wav
语音文件 44K采样率,16bit,单通道)
• 
基频标注文件(全部经过人工标注)
• 
文本标注文件(韵律词+韵律短语+韵律句+汉字+拼音,全部经过人工校对,与实际录音一致)
• 
音节切分文件(全部经过人工切分)


语料库文本类型:
• 
中文基础句     :共6005
• 
中文行业句      1463
• 
中文数字多形态 293
• 
中文轻声       541
• 
中文儿化音     137
• 
中文儿化音     137
• 
中文单汉字     2075
• 
英文字母多形态 603
• 
英文单词       625
• 
英文句子       316
• 
英文多形态     51


晓玲语料库——部分录音试听:(请用ie浏览器试听)


晓玲语料库——语音合成应用试听:(请用ie浏览器试听)



其他更全面的语音合成试听效果,请点击下方资料下载,下载emTTS语音合成软件



资料下载:点击进入相关页面

收缩
  • 电话咨询

  • 010-62986600
  •  15321801789
  •  官方微信号