[发明专利]一种字幕语音精准同步系统及方法、信息数据处理终端有效
申请号: | 201810289373.3 | 申请日: | 2018-04-03 |
公开(公告)号: | CN108597497B | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 孙宏亮;程国艮 | 申请(专利权)人: | 中译语通科技股份有限公司 |
主分类号: | G10L15/05 | 分类号: | G10L15/05;G10L15/06;G10L15/065;G10L21/0208;G06F40/58 |
代理公司: | 北京万贝专利代理事务所(特殊普通合伙) 11520 | 代理人: | 马红 |
地址: | 100040 北京市石*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字幕 语音 精准 同步 系统 方法 信息 数据处理 终端 | ||
1.一种字幕语音精准同步方法,其特征在于,所述字幕语音精准同步方法采用语音切分技术切分时间轴,通过语音分析系统进行机器识别;对原文进行智能翻译,分为原文分析、原文译文转换和译文生成3个阶段;运用流媒体服务器将音视频以流的方式在网络中传送;
所述采用语音切分技术切分时间轴,通过语音分析系统进行机器识别进一步包括:采用两遍的维纳滤波技术消除背景噪声;采用混合高斯建模的方法去除垃圾语音;采用谐波检测技术有效检测语音起始点;
采用基于WFST的Cross-word静态搜索空间构建方法,将WFST用在语音识别领域则融入了声学处理特征,将声学模型、声学上下文、发音词典及语言模型等通过WFST紧密结合,并在WFST上进行搜索;通过充分的双调归并算法优化网络;
采用基于最小化句子错误率的鉴别性训练准则进行声学模型自适应;
支持32路语音数据流的实时识别。
2.如权利要求1所述的字幕语音精准同步方法,其特征在于,所述原文分析、原文译文转换和译文生成3个阶段将原文译文转换阶段与原文分析阶段结合在一起,而把译文生成阶段独立起来,建立相关分析独立生成系统;把原文分析阶段独立起来,把原文译文转换阶段同译文生成阶段结合起来,建立独立分析相关生成系统;把原文分析、原文译文转换与译文生成分别独立开来,建立独立分析独立生成系统。
3.一种如权利要求1所述字幕语音精准同步方法的字幕语音精准同步系统,其特征在于,所述字幕语音精准同步系统包括:
机器识别模块,采用语音切分技术切分时间轴后,通过语音分析系统进行机器识别;
机器翻译模块,在机器识别出语音的基础上,对原文进行智能翻译;
流媒体直播模块,运用流媒体服务器将音视频以流的方式在网络中传送。
4.如权利要求3所述的字幕语音精准同步系统,其特征在于,所述机器识别模块包括:获取特征向量、声学模型、语言模型、解码器。
5.一种实现权利要求1~2任意一项所述字幕语音精准同步方法的信息数据处理终端。
6.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1-2任意一项所述的字幕语音精准同步方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中译语通科技股份有限公司,未经中译语通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810289373.3/1.html,转载请声明来源钻瓜专利网。