[发明专利]基于改进声调核模型的汉语语音声调识别方法无效
申请号: | 201310185819.5 | 申请日: | 2013-05-20 |
公开(公告)号: | CN103325372A | 公开(公告)日: | 2013-09-25 |
发明(设计)人: | 毛峡;魏鹏飞 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G10L17/16 | 分类号: | G10L17/16 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种可以提高4种声调平均识别率的方法,该方法为:提出了一种改进的声调核模型;设计了一种自适应提取孤立音节基频曲线声调核的算法,该算法首先移除首尾部分的野值段,然后对经过Viterbi分割及T假设检验合并后的分段结果进行声调核决策,得到声调核。设计了三组利用不同方法进行声调识别的实验,实验A提取整个音节的声学特征进行声调识别,实验B基于传统声调核模型提取声调核的声学特征进行声调识别,实验C利用改进的声调核模型自适应提取声调核的声学特征进行声调识别。实验结果表明利用基于改进的声调核模型提取的声调核进行声调识别可以提高4种声调的平均识别率。 | ||
搜索关键词: | 基于 改进 声调 模型 汉语 语音 识别 方法 | ||
【主权项】:
本发明提出了一种改进的声调核模型,将孤立音节的基频曲线划分为起始野值段,起始过渡段,声调核,末尾过渡段,末尾野值段五部分;其中起始野值段与末尾野值段属于基频野值,是由于音节分割无法100%准确分离有音部分与无音部分而产生的随机分布的基频值;起始过渡段与末尾过渡段是由复杂的喉部机械生理结构而导致的基频曲线波动,对声调的听辨不起作用;声调核是决定声调类型的关键部分,最能体现声调基频变化的趋势。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310185819.5/,转载请声明来源钻瓜专利网。
- 上一篇:便捷式引伸计夹持装置
- 下一篇:一种测量动物粪便温室气体排放速率的静态箱