[发明专利]语音识别装置及方法有效
申请号: | 201510294261.3 | 申请日: | 2015-06-02 |
公开(公告)号: | CN106297775B | 公开(公告)日: | 2019-11-19 |
发明(设计)人: | 林海兴 | 申请(专利权)人: | 富泰华工业(深圳)有限公司;鸿海精密工业股份有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/02;G06F16/40 |
代理公司: | 44334 深圳市赛恩倍吉知识产权代理有限公司 | 代理人: | 刘丽华<国际申请>=<国际公布>=<进入 |
地址: | 518109 广东省深圳市宝安区观澜街道大三社*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种语音识别装置及方法,该装置包括存储单元及处理单元,该存储单元存储有第一数据库及第二数据库,该第一数据库用于存储预设数量段的语音、每段语音的特征值及各用户的语音特征平均值,该第二数据库用于存储历史语音数据,该处理单元包括第一训练模块,当第一数据库中新存储有一段语音时,对该段新存储的语音在内的所有语音进行语音训练;转移模块,在所有语音完成语音训练时,将第一数据库中最早存储的一段语音转移存储至第二数据库;及第二训练模块,在该最早存储的一段语音转移存储至第二数据库时,对第二数据库中的所有语音进行语音训练。本发明在数据量较少的第一数据库中进行语音训练,减少了语音训练的耗时。 | ||
搜索关键词: | 语音 识别 装置 方法 | ||
【主权项】:
1.一种语音识别装置,该装置包括一存储单元及一处理单元,其特征在于:该存储单元存储有一第一数据库及一第二数据库,该第一数据库用于存储预设数量段的语音、每段语音的特征值及各用户的语音特征平均值,该第二数据库用于存储该第一数据库未存储的历史语音数据,该处理单元包括:/n第一训练模块,用于当第一数据库中新存储有一段语音时,对该段新存储的语音在内的所有语音进行语音训练;/n转移模块,用于在所有语音完成语音训练时,将第一数据库中最早存储的一段语音转移存储至第二数据库;/n第二训练模块,用于在该最早存储的一段语音转移存储至第二数据库时,对第二数据库中的所有语音进行语音训练;/n群组划分模块,用于将第一数据库及第二数据库中存储的多个用户的语音、每段语音的特征值及各用户的语音特征平均值划分为相同的多个群组;/n第一识别模块,用于当第一数据库对应的群组中新存储有一段待识别语音时,基于第一数据库中对应的群组对该段待识别语音的发音人的身份进行识别;及/n第二识别模块,用于在该段待识别语音的发音人的身份无法被第一识别模块识别成功时,基于第二数据库中对应的群组对该段待识别语音的发音人的身份进行识别。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富泰华工业(深圳)有限公司;鸿海精密工业股份有限公司,未经富泰华工业(深圳)有限公司;鸿海精密工业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510294261.3/,转载请声明来源钻瓜专利网。