[发明专利]一种字幕语音精准同步系统及方法、信息数据处理终端有效

申请号：	201810289373.3	申请日：	2018-04-03
公开（公告）号：	CN108597497B	公开（公告）日：	2020-09-08
发明（设计）人：	孙宏亮;程国艮	申请（专利权）人：	中译语通科技股份有限公司
主分类号：	G10L15/05	分类号：	G10L15/05;G10L15/06;G10L15/065;G10L21/0208;G06F40/58
代理公司：	北京万贝专利代理事务所(特殊普通合伙) 11520	代理人：	马红
地址：	100040 北京市石***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种字幕语音精准同步系统方法信息数据处理终端
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种字幕语音精准同步方法，其特征在于，所述字幕语音精准同步方法采用语音切分技术切分时间轴，通过语音分析系统进行机器识别；对原文进行智能翻译，分为原文分析、原文译文转换和译文生成3个阶段；运用流媒体服务器将音视频以流的方式在网络中传送；

所述采用语音切分技术切分时间轴，通过语音分析系统进行机器识别进一步包括：采用两遍的维纳滤波技术消除背景噪声；采用混合高斯建模的方法去除垃圾语音；采用谐波检测技术有效检测语音起始点；

采用基于WFST的Cross-word静态搜索空间构建方法，将WFST用在语音识别领域则融入了声学处理特征，将声学模型、声学上下文、发音词典及语言模型等通过WFST紧密结合，并在WFST上进行搜索；通过充分的双调归并算法优化网络；

采用基于最小化句子错误率的鉴别性训练准则进行声学模型自适应；

支持32路语音数据流的实时识别。

2.如权利要求1所述的字幕语音精准同步方法，其特征在于，所述原文分析、原文译文转换和译文生成3个阶段将原文译文转换阶段与原文分析阶段结合在一起，而把译文生成阶段独立起来，建立相关分析独立生成系统；把原文分析阶段独立起来，把原文译文转换阶段同译文生成阶段结合起来，建立独立分析相关生成系统；把原文分析、原文译文转换与译文生成分别独立开来，建立独立分析独立生成系统。

3.一种如权利要求1所述字幕语音精准同步方法的字幕语音精准同步系统，其特征在于，所述字幕语音精准同步系统包括：

机器识别模块，采用语音切分技术切分时间轴后，通过语音分析系统进行机器识别；

机器翻译模块，在机器识别出语音的基础上，对原文进行智能翻译；

流媒体直播模块，运用流媒体服务器将音视频以流的方式在网络中传送。

4.如权利要求3所述的字幕语音精准同步系统，其特征在于，所述机器识别模块包括：获取特征向量、声学模型、语言模型、解码器。

5.一种实现权利要求1～2任意一项所述字幕语音精准同步方法的信息数据处理终端。

6.一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得计算机执行如权利要求1-2任意一项所述的字幕语音精准同步方法。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中译语通科技股份有限公司，未经中译语通科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810289373.3/1.html，转载请声明来源钻瓜专利网。