[发明专利]一种基于生成式对抗网络的语音生成方法及装置有效
申请号: | 201810428470.6 | 申请日: | 2018-05-07 |
公开(公告)号: | CN108597496B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 高永裕 | 申请(专利权)人: | 广州势必可赢网络科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L17/02;G10L17/04;G10L17/08;G10L17/22;G10L25/51 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 510000 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于生成式对抗网络的语音生成方法,该方法将随机生成的符合高斯分布的噪音数据通过生成模型转换为模拟样本,由于该模拟样本不具备语言内容,故当生成模型和判别模型在循环更新时,生成模型需要学习的生成能力和判别模型需要学习的判别能力均相应增多,由此提高了生成模型的生成能力和判别模型判别能力,当训练样本和模拟样本的对比值不大于预设的阈值时,即认为生成模型已具备生成真实数据的能力,那么通过该生成模型生成的语音数据库则具有足够的真实性,应用其进行身份识别可以提高识别率。相应地,本发明公开的一种基于生成式对抗网络的语音生成方法、装置、设备及计算机可读存储介质,也同样具有上述技术效果。 | ||
搜索关键词: | 一种 基于 生成 对抗 网络 语音 方法 装置 | ||
【主权项】:
1.一种基于生成式对抗网络的语音生成方法,其特征在于,包括:获取目标语音数据包含的MFCC特征数据,并将所述MFCC特征数据转换为训练样本;按照预设的生成规则随机生成符合高斯分布的噪音数据,并通过生成模型将所述噪音数据转换为模拟样本;通过判别模型对比所述训练样本和所述模拟样本,得到所述训练样本和所述模拟样本的对比值,将所述对比值反馈至所述生成模型,以使所述生成模型和所述判别模型基于互相对抗过程循环更新;当所述对比值不大于预设的阈值时,通过所述生成模型生成目标人物对应的语音数据库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州势必可赢网络科技有限公司,未经广州势必可赢网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810428470.6/,转载请声明来源钻瓜专利网。