[发明专利]一种小语料语音识别方法及系统在审
申请号: | 201910455300.1 | 申请日: | 2019-05-29 |
公开(公告)号: | CN110176228A | 公开(公告)日: | 2019-08-27 |
发明(设计)人: | 黄志春;张定国;李永锡;陈育翔;伍宇文 | 申请(专利权)人: | 广州伟宏智能科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/08;G10L15/18;G10L15/26;G10L15/28;G10L25/69 |
代理公司: | 广州蓝晟专利代理事务所(普通合伙) 44452 | 代理人: | 陈梓赫;栾洋洋 |
地址: | 510660 广东省广州市天河区车*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语料 语音识别 语音数据 标注 输出识别 训练模型 语音训练 结构科学 模型构建 语义标注 语义识别 语音采集 自动修改 识别率 训练集 分类 构建 出错 运算 抽取 验证 保存 | ||
本发明公开了一种小语料语音识别方法及系统,包括语音采集、语音识别分类、构建训练模型、代入训练模型、判断识别结果和输出识别结果,本发明结构科学合理,使用安全方便,首先对小语料语音数据抽取收集,对小语料语音数据进行分类标注,可以节省标注语料的时间,避免工作人员在标注时出错,随后将小语料语音数据代入至小语料语音识别模型内,进行运算,输出识别结果,若识别结果未达到预定识别值,则保存小语料语音数据至训练集内,语音训练模型构建时,首先会获取相关的语料数据,对语料进行语义识别,进行语义标注,得出语音训练模型,对训练出的模型进行验证,若是识别率过低,则自动修改参数并继续进行新一轮训练。
技术领域
本发明涉及语音识别技术领域,具体为一种小语料语音识别方法及系统。
背景技术
语料,即语言材料,语料是语言学研究的内容,语料是构成语料库的基本单元,在对语音进行识别时,由于部分语音中含有的语料过于罕见,语音识别系统容易产生无法识别的情况,并且目前市面上现有的语音识别都是针对通用场景进行处理,针对小语料的训练识别效果一般,获得的效果一般,同时针对特定客户的特定需求,或者特定行业的需求不能很好的满足或者说代价太大;
本发明针对小语料进行训练,在得到的训练模型中选取最优模型,使用了深度学习神经网络进行模型训练,同时针对性的去获取相关语料,可以节省标注语料的时间,并可避免人在标注时出错,导致训练模型出现准确性上的错误,另一方面还结合了语义识别的方法,能够保证输出的内容更加准确。
发明内容
本发明提供技术方案,可以有效解决上述背景技术中提出的针对小语料的训练识别效果一般,获得的效果一般,同时针对特定客户的特定需求,或者特定行业的需求不能很好的满足或者说代价太大的问题。
为实现上述目的,本发明提供如下技术方案:一种小语料语音识别方法,包括如下步骤:
S1、语音采集:抽取需要识别的小语料语音数据,并传输至主机内进行存储;
S2、语音识别分类:将语音进行初步识别,分类保存在对应的文件夹中;
S3、构建训练模型:构建小语料语音识别训练模型,并对训练模型的准确性进行验证;
S4、代入训练模型:将分类保存的小语料语音数据代入至小语料语音识别模型内,输出识别结果;
S5、判断识别结果:分析识别结果,并将分析结果与预定值进行对比;
S6、输出识别结果:将小语料语音数据识别结果,转化为对应的汉字输出。
根据上述技术特征,所述步骤S1中,抽取小语料语音数据时,会采用写好的脚本工具进行收集,并传输至主机内进行存储。
根据上述技术特征,所述步骤S2中,获取的小语料语音数据,会通过Keras、TensorFlow基于深度卷积神经网络和长短时记忆神经网络、注意力机制以及CTC实现,对小语料语音数据进行分类标注和保存。
根据上述技术特征,所述步骤S3具体分为如下步骤:
a、音频数据提取:根据模型建立需求针对性获取相关的语料数据,并对语料进行音频数据分析提取;
b、特征标注:使用语义识别的方法对提取到的音频数据进行语义识别,将音频数据以分句、分词的形式进行语义标注;
c、构建模型:使用深度学习网络对音频数据进行训练,得出语音训练模型;
d、准确性验证:针对每次训练出来的模型进行验证,计算出训练模型得出的识别率;
e、保存模型:若是识别率达到标准,则保存训练模型,若是识别率过低,则自动修改参数并继续进行新一轮训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州伟宏智能科技有限公司,未经广州伟宏智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910455300.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音识别的方法以及相关装置
- 下一篇:一种语音处理方法和装置