[发明专利]一种字幕语音精准同步系统及方法、信息数据处理终端有效
申请号: | 201810289373.3 | 申请日: | 2018-04-03 |
公开(公告)号: | CN108597497B | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 孙宏亮;程国艮 | 申请(专利权)人: | 中译语通科技股份有限公司 |
主分类号: | G10L15/05 | 分类号: | G10L15/05;G10L15/06;G10L15/065;G10L21/0208;G06F40/58 |
代理公司: | 北京万贝专利代理事务所(特殊普通合伙) 11520 | 代理人: | 马红 |
地址: | 100040 北京市石*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字幕 语音 精准 同步 系统 方法 信息 数据处理 终端 | ||
本发明属于计算机软件技术领域,公开了一种字幕语音精准同步系统及方法、信息数据处理终端,机器识别模块应用多种技术提高抗噪性能,采用两遍的维纳滤波技术消除背景噪声;采用混合高斯建模的方法去除垃圾语音,使用GMM对36种自然环境的声音进行识别正确率95.83%;采用谐波检测技术有效检测语音起始点,相比传统语音识别方法识别速度在现有技术基础上提升了100%,同时识别准确率得到有效提升,达到2倍以上。本发明把原文分析、原文译文转换与译文生成分别独立开来,建立独立分析独立生成系统。在这样的系统中,分析原语时不考虑译语的特点,生成译语时也不考虑原语的特点,原语译语的差异通过原文译文转换来解决。
技术领域
本发明属于计算机软件技术领域,尤其涉及一种字幕语音精准同步系统及方法、信息数据处理终端。
背景技术
对于汉语语音识别,又可选择词、音节、声韵母作为语音识别单元,选择的基元越小,识别的灵活性越高,但稳定性降低,反之亦然。此外,汉语结构复杂,有1312个带声调音节,432个不考虑声调的音节,22个声母,38个韵母,庞大的汉语体量及其复杂结构是语音识别技术攻克的难点。然而,这一技术的突破也将为视频流量领域从上到下的供应商主体和消费主体提供前所未有的便捷服务,有效提高该领域的经济效益。
发明内容
所述字幕语音精准同步无非语音识别和字幕翻译两大关键技术,进入21世纪,随着计算机网络的推行,使得语音识别技术的发展更加如鱼得水,诸多表示法、演算法也日新月异,使得语音识别系统的开发,衍生了更多元的组合。传统的语音识别思路是在统计语音识别的基础上,利用统计模型进行建模,近年来,许多的解码战略和各种解码功能被应用到解码器中,为新兴的语音识别方法打开了便捷之门。同时,字幕翻译技术同样与时俱进,伴随大数据的发展,多语言样本库获取便利,语义分析方法不断更新升级,更快更准确的翻译算法使得字幕语音精准同步成为可能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中译语通科技股份有限公司,未经中译语通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810289373.3/2.html,转载请声明来源钻瓜专利网。