[发明专利]一种窗口级别的混合专家模型及其生成方法在审

专利信息
申请号: 202210929376.5 申请日: 2022-08-03
公开(公告)号: CN115310457A 公开(公告)日: 2022-11-08
发明(设计)人: 张婷;曾致远;熊德意;程国艮 申请(专利权)人: 中译语通科技股份有限公司
主分类号: G06F40/44 分类号: G06F40/44;G06F40/58
代理公司: 北京绘聚高科知识产权代理事务所(普通合伙) 11832 代理人: 罗硕
地址: 100043 北京市石*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开一种窗口级别的混合专家模型及其生成方法,其中,窗口级别的混合专家模型的生成方法包括:根据预定语句划分规则,将输入的语句划分为一个或多个窗口,其中,窗口的数量小于语句中词的数量;通过路由算法选择窗口对应的专家模型,将窗口发送至专家模型进行翻译。本发明的技术方案能解决现有技术中混合专家模型的训练不稳定,训练效果反复振荡的问题。
搜索关键词: 一种 窗口 级别 混合 专家 模型 及其 生成 方法
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中译语通科技股份有限公司,未经中译语通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202210929376.5/,转载请声明来源钻瓜专利网。

同类专利
  • 翻译方法及电子设备-202210243383.X
  • 李世尧;张穗云;刘畅 - 华为技术有限公司
  • 2022-03-11 - 2023-09-19 - G06F40/44
  • 本申请提供一种翻译方法及电子设备,涉及终端技术领域,能够解决现有的机器翻译方法不能满足不同场景的翻译需求,翻译效果较差,准确率较低的问题。方法包括:电子设备获取待翻译的第一文本的第一概率分布,第一文本的语言为第一语种,第一文本中包括至少一个词语,第一概率分布用于指示至少一个词语中每个词语对应的候选译文的概率。电子设备获取目标语料库,目标语料库中包括多个由第一语种表示的文本以及对应的第二语种表示的文本组成的语句对。电子设备根据第一概率分布以及目标语料库确定第一文本的第二概率分布,根据第二概率分布确定第一文本对应的第二文本,第二文本的语言为第二语种。
  • 语音识别结果的确定方法及装置、存储介质及电子装置-202110129021.3
  • 张卓博;苏腾荣;赵培;孙雨新 - 青岛海尔科技有限公司;海尔智家股份有限公司
  • 2021-01-29 - 2023-07-21 - G06F40/44
  • 本发明提供了一种语音识别结果的确定方法及装置、存储介质及电子装置,其中,上述语音识别结果的确定方法包括:将待识别的语音指令转换为第一文本信息,并将所述第一文本信息转换为第一音素串信息;将所述第一音素串信息输入到编码解码模型中,得到对第二文本信息,其中,所述编码解码模型保存有字或词的时序关系,所述时序关系用于指示所述字后接的出现概率最大的字或词语,以及所述词语后接的出现概率最大的字或词语;确定所述第一文本信息的第一置信度和所述第二文本信息的第二置信度,将所述第一置信度和所述第二置信度中高置信度所对应的文本信息作为所述语音指令的语音识别结果。
  • 文本数据的分析方法、模型训练方法、装置及计算机设备-202210074604.5
  • 姜鹏;高鹏;谯轶轩 - 平安科技(深圳)有限公司
  • 2022-01-21 - 2023-07-18 - G06F40/44
  • 本申请公开了一种文本数据的分析方法、模型训练方法、装置及计算机设备,该分析方法获取待处理的文本数据和文本数据对应的第一情感标签;文本数据中包括多个单词;将文本数据和第一情感标签输入至文本分析模型,通过文本分析模型提取文本数据中的情感特征语句,得到第一输出概率和第二输出概率;第一输出概率用于表征文本数据中的各个单词为情感特征语句的起始单词的预测概率,第二输出概率用于表征文本数据中的各个单词为情感特征语句的终止单词的预测概率;根据第一输出概率和第二输出概率,从文本数据中确定情感特征语句。该分析方法能够从文本数据中提取出情感特征语句,且提取效率和准确度较高。本申请可广泛应用于人工智能技术领域内。
  • 一种文本翻译方法及装置-201811393972.6
  • 王亚楠;刘俊华;孟廷;王建社;方昕;柳林;魏思;胡国平 - 科大讯飞股份有限公司
  • 2018-11-21 - 2023-05-30 - G06F40/44
  • 本申请公开了一种文本翻译方法及装置,该方法包括:首先,利用预先构建的文本翻译模型对源文本进行翻译,其中,文本翻译模型包括对应于通用领域的一个翻译子模型以及对应于不同特定领域的不同翻译子模型,各个翻译子模型的部分参数共享,然后,可以获取到各个翻译子模型进行翻译后输出的各个目标文本,接着,可以从各个目标文本中选择出源文本的最终翻译文本,可见,本申请在对源文本进行翻译时,通过部分参数共享的各个不同领域的翻译子模型和通用领域的翻译子模型进行翻译,再从所有得到的翻译后的文本中选出最终的翻译文本,不仅能够缩小模型的大小,还能够兼顾通用领域以及其他特定领域的翻译质量,从而可以提高对源文本的翻译质量。
  • 信息处理方法、装置和电子设备-202110866775.7
  • 曹军;蒋庆男;赵程绮;王明轩;李磊;王晓晖 - 北京有竹居网络技术有限公司
  • 2021-07-29 - 2023-05-26 - G06F40/44
  • 本公开实施例公开了信息处理方法、装置和电子设备。该方法包括:获取将使用源语言表达的待翻译信息输入到预训练的第一翻译模型得到的第一隐状态向量,和所述第一隐状态向量被预测为预设词汇表中各词的第一概率分布;从目标语言的向量索引库中,获取与所述第一隐状态向量满足预设条件的至少一个目标索引项,所述目标索引项包括第二隐状态向量;确定所述第二隐状态向量的第二概率分布;融合所述第一概率分布和所述第二概率分布,得到融合概率分布;利用所述融合概率分布确定翻译结果。实现了实时构建数据索引,基于近邻检索,对神经机器翻译模型的解码过程进行干预,可以提升机器翻译模型的领域表现。
  • 基于字频词频的字符分组方法、存储介质及电子设备-202211416941.4
  • 田辉;朱鹏远;鲁国峰;郭玉刚;张志翔 - 合肥高维数据技术有限公司
  • 2022-11-14 - 2023-05-05 - G06F40/44
  • 本发明特别涉及一种基于字频词频的字符分组方法、存储介质及电子设备,其中该字符分组方法包括如下步骤:遍历语料库,计算待分组的N个字符的概率及其所组成的各词语概率;根据字符概率和词语概率计算状态转移矩阵;对状态转移矩阵进行归一化得到归一化的状态转移矩阵;逐一遍历字符,计算待分配字符c分配到所有分组的权重并将字符c添加到权重最大的组,该权重和随机二元字符包含组别数的期望值正相关,以此类推直到所有字符完成分组。通过权重计算公式,让经常出现在一起的两个字符分在不同组时的权重增大,再通过选择权重最大的组来让一起出现的字符尽量不同组,实现了字符的合理分组,该分组方式对每组中字符个数不做限制,从而更加合理。
  • 一种基于可随机访问的点互信息的词表示学习方法-202211623207.5
  • 陈怡疆;林海;苏畅 - 厦门大学
  • 2022-12-16 - 2023-04-11 - G06F40/44
  • 一种基于可随机访问的点互信息的词表示学习方法,涉及自然语言处理。A.准备大规模无标注文本语料库;B.扫描所述语料库并统计词对得到词共现矩阵;C.用基于GloVe模型的大规模矩阵随机访问方法实现对词共现矩阵的随机访问,得到该矩阵的元素的近似值;D.用随机访问得到的词共现矩阵的元素的近似值计算点互信息;E.基于点互信息计算注意力权重,将注意力权重应用于Skip‑gram或GloVe模型词表示学习得到目标词表示。提出点互信息注意力权重算子,提出适合Skip‑gram和GloVe模型的注意力机制,针对计算点互信息时使用的共现矩阵过大无法完整载入内存,提出随机访问方法。获得更高质量的词表示。
  • 词对齐模型训练、文本处理的方法、系统、设备和介质-202011374919.9
  • 鲍开放;俞谦;李健 - 上海携旅信息技术有限公司
  • 2020-11-30 - 2023-04-07 - G06F40/44
  • 本发明公开了一种词对齐模型训练、文本处理的方法、系统、设备和介质,词对齐模型的训练方法包括:获取样本双语语料;基于所述样本双语语料训练得到分词模型;将所述样本双语语料输入至所述分词模型以获取分词结果;获取所述分词结果对应的词对齐结果;基于所述分词结果训练得到翻译模型,其中,所述翻译模型用于输出与所述分词结果对应的注意力矩阵;基于所述词对齐结果和所述注意力矩阵训练得到词对齐模型。本发明通过与双语语料对应的词对齐结果和翻译模型对应的注意力矩阵训练得到词对齐模型,优化了词对齐模型,提高了词对齐模型的精度,优化了占位符的映射准确性,提高了实体词翻译准确性,提高了文本整体的翻译准确性。
  • 文本翻译方法、装置、设备及存储介质-202111068501.X
  • 刘宜进;孟凡东 - 腾讯科技(深圳)有限公司
  • 2021-09-13 - 2023-03-17 - G06F40/44
  • 本申请公开了一种文本翻译方法、装置、设备及存储介质。所述方法包括:获取候选的a个翻译模型针对目标领域的待翻译文本分别生成的模型译文;基于a个翻译模型分别对应的模型译文,获取a个翻译模型分别对应的准确度参数和区别度参数;其中,对于a个翻译模型中的目标翻译模型,目标翻译模型的准确度参数用于表征目标翻译模型的翻译准确度,目标翻译模型的区别度参数用于表征目标翻译模型与其它翻译模型之间的区别度;基于a个翻译模型分别对应的准确度参数和区别度参数,从a个翻译模型中选取b个翻译模型,所述b个翻译模型用于所述目标领域的文本翻译。本申请能够提高选择的翻译模型的多样性,提高了模型集成后生成的译文结果的准确度。
  • 翻译方法、装置、电子设备及计算机可读存储介质-202010450957.1
  • 冉邱;林衍凯;李鹏;周杰 - 腾讯科技(深圳)有限公司
  • 2020-05-25 - 2023-01-13 - G06F40/44
  • 本发明提供了一种翻译方法、装置、电子设备及计算机可读存储介质,该方法包括:获取待翻译句子;基于预设数量,对所述待翻译句子进行划分,得到所述预设数量的子句;对各所述子句分别进行翻译,得到各所述子句对应的翻译结果;对各所述子句对应的翻译结果进行融合,得到所述待翻译句子对应的目标翻译句子。在该方案中,由于,各子句包括待翻译句子中的至少两个词,在对各子句分别进行翻译时,即可以并行对待翻译句子中的至少两个词进行翻译,而不是对待翻译句子一个词一个词的进行翻译,从而在得到翻译句子对应的目标翻译句子的过程中,可以加快翻译速度。
  • 一种翻译模型训练方法、信息翻译方法及相关设备-202210887732.1
  • 阿敏巴雅尔;胡博杰 - 腾讯科技(深圳)有限公司
  • 2022-07-26 - 2022-10-21 - G06F40/44
  • 本申请公开了一种翻译模型训练方法、信息翻译方法及相关设备,该翻译模型训练方法,包括:获取训练数据集合;对待翻译信息进行预处理,得到预处理后的待翻译信息;获取第二语种词表;构建预设机器学习模型;将预处理后的待翻译信息输入编码模块,得到待翻译特征信息;将待翻译特征信息和译文信息输入解码模块,得到第一目标词概率分布;基于每个目标词的第一概率值和译文信息,确定翻译损失值;基于第一目标词概率分布中目标关键词的第一概率值和目标关键词标签值,确定关键词损失值;基于翻译损失值和关键词损失值,对预设机器学习模型进行更新训练,得到翻译模型。如此,可以提高翻译模型对于待翻译信息中关键词的翻译能力。
  • 用户画像识别方法、推送方法、装置、设备和存储介质-201811062397.1
  • 方建生 - 广州视源电子科技股份有限公司
  • 2018-09-12 - 2022-09-13 - G06F40/44
  • 本发明公开了一种用户画像识别方法,包括:获取用户进行网络访问的行为数据,并确定所述行为数据所对应的文本;根据所述文本以及行为数据确定文本词频,并根据所述词频对所述行为数据进行筛选,以确定关键行为数据;根据所述关键行为数据识别所述用户的用户画像。使用该方法解决了通过获取用户填写的信息后,确定用户画像可能产生的不准确的问题。实现了自动采集用户进行网络访问的行为数据,通过分析确定用户画像的有益效果。
  • 翻译方法、装置及计算机程序产品-202210526893.8
  • 张睿卿;刘辉;何中军;李芝;吴华 - 北京百度网讯科技有限公司
  • 2022-05-16 - 2022-09-02 - G06F40/44
  • 本公开提供了一种翻译方法、装置、电子设备、存储介质及计算机程序产品,涉及人工智能技术领域,具体涉及深度学习技术,可用于翻译场景下。具体实现方案为:通过编码模块确定待翻译语句的编码特征;通过图网络模块基于预设图网络,确定待翻译语句的知识融合特征,其中,预设图网络基于待翻译语句对应的源语种中的多义词以及多义词在翻译后语种中对应的多个翻译词构建;基于编码特征和知识融合特征,通过解码网络确定待翻译语句对应的翻译后语句。本公开避免了现有技术中基于干预的机器翻译模型难以对句子进行全局理解的问题,提高了翻译准确度。
  • 基于词频的日志处理方法、介质、装置和计算设备-202210338260.4
  • 陈诚;胡涛;陆春红;樊军阳 - 杭州网易云音乐科技有限公司
  • 2022-04-01 - 2022-08-16 - G06F40/44
  • 本公开的实施方式提供了一种基于词频的日志处理方法、介质、装置和计算设备,获取多个接口请求的日志对应的文本;针对每个接口请求,对接口请求对应的文本进行分词处理,获得文本中的多个待处理词语;根据多个待处理词语在文本中的词频,确定接口请求对应的至少一个目标片段;根据多个接口请求对应的目标片段,确定多个接口请求中的同源接口请求。通过本方案,最大程度利用了每个词语的词频特征来获得目标片段,其准确性更高,同时避免了采用逆文本频率对日志进行处理时,日志中词语无穷小而无法进行计算区分的问题,可以提升同源接口请求判定结果的准确性,进而根据判定结果进行进一步处理,提升平台的处理效率。
  • 一种用于在线教育的陪练纠错方法及装置-202210180533.7
  • 林东姝 - 杭州小伴熊科技有限公司
  • 2022-02-25 - 2022-07-29 - G06F40/44
  • 本发明涉及一种用于在线教育的陪练纠错方法及装置,所述方法包括以下步骤:实时采集学员答题文本信息,判断答题文本信息中答题答案信息是否正确,并将答题答案信息错误的答题文本信息归纳于错题库;对错题库内的知识点进行统计,并计算每个知识点的权重;根据知识点权重对云端题库进行题目提取,并按照知识点权重大小排序,生成错题试卷。本发明可以对在线教育中,学员的相同问题、相似问题、同类问题错误进行收集,分析学员对于每个知识点的学习情况;通过将学员的学习情况和实际章节知识点重要情况进行结合,对学员进行加强型的学习指导,以实现能够帮助学员掌握章节内所有知识点,提高学习成绩。
  • 翻译结果的评估方法、装置、设备及存储介质-202210363800.4
  • 申利彬 - 北京爱奇艺科技有限公司
  • 2022-04-07 - 2022-07-05 - G06F40/44
  • 本申请涉及一种翻译结果的评估方法、装置、设备及存储介质,其中,所述方法包括:获取源语言数据和翻译后的目标语言数据;确定所述源语言数据的第一统计特征以及确定所述目标语言数据的第二统计特征;计算所述源语言数据和所述目标语言数据之间的语义相似度;计算所述目标语言数据的语言质量特征;其中,所述语言质量特征用于表征所述目标语言数据是否符合语法;将所述第一统计特征、所述第二统计特征、所述语义相似度和所述语言质量特征输入到深度神经网络模型中,得到评估结果。本申请用以解决无法对翻译结果进行准确评估,导致翻译效率低的技术问题。
  • 一种获取阅读心像信息量的计算方法及装置-201910374492.3
  • 周建设;张凯;张文彦;史金生;王伟丽;刘杰;张猷猷 - 首都师范大学
  • 2019-05-07 - 2022-06-21 - G06F40/44
  • 本发明提供了一种获取阅读心像信息量的计算方法及装置。该计算方法包括,步骤1:获取待统计的电子文本样本,识别其文体并归类;步骤2:统计电子文本的字数;步骤3:获取用户对不同文体的平均阅读速度;步骤4:计算用户对不同文体的平均阅读时长;步骤5:对比用户的实际阅读时长和平均阅读时长判断阅读的完整度;步骤6:判别用户是否为深度阅读状态;步骤7、计算用户在深度阅读状态下的心像信息量,并构建模型。本发明通过智能化判别用户是否进入深度阅读状态,以及计算用户在深度阅读状态下的心像获取量,可得出用户对阅读文本的文体偏好,是实现阅读文本智能化推送基础要素之一。
  • 一种数据处理方法、装置、计算机设备及存储介质-202210140138.6
  • 刘宜进;张松鸣;孟凡东;陈钰枫;徐金安 - 腾讯科技(深圳)有限公司;北京交通大学
  • 2022-02-15 - 2022-05-24 - G06F40/44
  • 本申请实施例公开了一种数据处理方法、装置、计算机设备以及存储介质。其中方法包括:获取样本语料集,样本语料集包括目标样本语料对,目标样本语料对包括第一样本语句和第二样本语句,第二样本语句是第一样本语句翻译后的语句;根据第一样本语句和第二样本语句中j‑1个数据对第二样本语句中第j个数据进行概率预测处理,得到第j个数据的第一预测概率;根据前j‑1个数据对第二样本语句的第j个数据进行概率预测处理,得到第j个数据的第二预测概率;根据第j个数据的第一预测概率和第二预测概率对初始模型进行训练,得到目标模型;获取输入语句,将输入语句输入目标模型,生成翻译后的输出语句。以使得文本翻译更准确,提高数据处理准确性。
  • 一种基于强化蒸馏的跨语言属性级情感分类方法-202210044125.9
  • 吴含前;王志可;吴国威;李露 - 东南大学
  • 2022-01-14 - 2022-05-03 - G06F40/44
  • 本发明提供了一种基于强化蒸馏的跨语言属性级情感分类方法,基于源语言语料训练一个教师网络,基于知识蒸馏框架将源语言语料中的属性情感信息迁移到目标分类器中;采用序列选择器根据特定的属性从目标翻译句子序列中选择属性情感相关的信息,向目标分类器提供去噪后的句子序列表示;使用自注意力层构建基于跨语言蒸馏的目标分类器,建模属性序列与去噪后的目标翻译句子序列间的细粒度交互。本发明缓解了翻译语料与真实语料之间的领域偏差问题,目标分类器具有更强的泛化能力。本发明能够充分利用源语言与目标翻译中有效的属性情感信息,同时更好地建模句子与属性之间的细粒度交互。本发明在情感分类的各方面性能都较基线方法有了一定提升。
  • 情感分析方法、装置、计算机设备和存储介质-202210081605.2
  • 王丽萍 - 平安科技(深圳)有限公司
  • 2022-01-24 - 2022-04-26 - G06F40/44
  • 本申请涉及人工智能技术,提出一种情感分析方法、装置、计算机设备和存储介质,该方法包括:获取同一个评价对象的不同评论文本;对所有评论文本中的名词进行词频统计,根据词频确定评价对象的评价维度;计算每条评论文本在对应的每个评价维度下的情感分数;对所有评论文本在相同评价维度下的情感分数进行聚类汇总,得到各个不同评价维度所对应的汇总数据;根据不同评价维度对应的汇总数据获取对评价对象的情感分析结果。本申请对评论文本中的名词的词频统计,挖掘出用户对评价对象所关注的评价维度,再对每个评论文本在对应的每个评价维度下的情感分数进行计算,分析出所有用户对该评价对象的各个不同评价维度的情感倾向。
  • 基于加权标签平滑的神经机器翻译模型训练方法-202210117255.0
  • 常宝宝;陈亮;许润昕 - 北京大学
  • 2022-02-08 - 2022-04-26 - G06F40/44
  • 本发明公布了一种基于加权标签平滑的神经机器翻译模型训练方法,属于自然语言处理中的机器翻译领域。本发明为了解决词汇共享和标签平滑两个技术潜在的冲突,首先通过计算源端词汇,共享词汇和目标端词汇,生成新的训练标签向量,使用新生成的标签向量进行序列到序列的神经机器翻译模型训练。本发明为模型注入额外的机器翻译任务相关的先验信息,加强模型在翻译任务上的表现;通过动态调节标签平滑,避免了将平滑概率仅分配给源端词汇产生的误差,进一步提高了神经机器翻译模型的性能。
  • 日志分析方法、装置、设备、介质和程序产品-202111584905.4
  • 陈翟翟;雷发林;吴泽君;李国莹;苑志云 - 中国建设银行股份有限公司
  • 2021-12-22 - 2022-04-15 - G06F40/44
  • 本公开提供了一种日志分析方法,可以应用于大数据技术领域和金融技术领域。该日志分析方法包括:获取故障日志文本和当前日志文本;根据故障日志文本中各词汇的频率计算得到多个第一句向量,根据当前日志文本中各词汇的频率计算得到多个第二句向量;对相同类型故障对应的第一句向量进行聚类,得到多个第一聚类簇;计算多个第一聚类簇的簇心;计算第二句向量到簇心的第一距离,根据第一距离对当前日志文本进行故障分析。本公开还提供了一种日志分析装置、设备、存储介质和程序产品。
  • 一种模型训练的方法、相关装置及设备-202110888099.3
  • 梁云龙;孟凡东;徐金安;陈钰枫 - 腾讯科技(深圳)有限公司
  • 2021-08-03 - 2022-04-12 - G06F40/44
  • 本申请实施例公开了一种模型训练的方法、相关装置及设备,用于提高模型生成译文的连贯性以及准确性。本申请实施例方法包括:获取源端文本集合、目标文本集合以及训练样本对,将源端文本集合、目标文本集合以及期望目标文本作为对话理解模型的输入,输出第一文本序列、第二文本序列以及文本相似度,第一文本序列以及第二文本序列对应于第二语种,文本相似度表示期望目标文本与目标文本集合的关联程度,将源端文本集合以及训练样本对作为文本翻译模型的输入,通过文本翻译模型获取第三文本序列,第三文本序列对应于第二语种,根据第一文本序列、第二文本序列、文本相似度、第三文本序列以及期望目标文本,对文本翻译模型的模型参数进行更新。
  • 翻译模型训练方法和翻译方法及其装置-202111250312.4
  • 刘恒双;张为泰;许瑞阳 - 科大讯飞股份有限公司
  • 2021-10-26 - 2022-03-18 - G06F40/44
  • 本发明实施例提供一种翻译模型训练方法和翻译方法及其装置。其中,模型训练方法包括:分别将平行双语句对中的源语言语句和加噪的源语言语句输入翻译模型,得到第一预测目标语言语句和第二预测目标语言语句,并分别获取翻译模型的第一预测概率分布、第二预测概率分布和/或各隐藏层输出的第一特征向量、第二特征向量;基于第一预测目标语言语句与平行双语句对中的目标语言语句、第二预测目标语言语句与加噪的源语言语句对应的目标语言语句、第一特征向量与第二特征向量和/或第一预测概率分布与第二预测概率分布,确定翻译模型的当前训练损失,调整翻译模型的参数。本发明实施例可以提升翻译模型的鲁棒性,并且训练方法简单,模型训练稳定。
  • 一种机器翻译自动优选系统-202111265456.7
  • 陈件;潘丽婷;张井 - 上海一者信息科技有限公司
  • 2021-10-28 - 2022-03-18 - G06F40/44
  • 一种机器翻译自动优选系统,包括优质双语数据收集模块,用于进行待翻译数据和目标翻译语种信息的特征获取;机翻译文获取模块,用于根据原文数据定期调用机器翻译引擎,获取对应机器翻译的译文;机器翻译质量评测训练模块,用于对所收集的双语语料和机翻译文获取模块中的翻译译文数据进行模型训练;机器翻译质量评测预测模块,用于根据用户输入需要翻译的句子信息预测出最适合引擎;进一步返回机器翻译的译文。本发明克服了现有技术的不足,在缺乏某个机翻引擎译文结果情况下,依据原文文本、语言方向、机翻引擎类型三类特征,预测该机翻引擎译文的人工编辑距离,从而对机翻引擎翻译质量进行排序,筛选出某一个语言方向下某一原文的最佳机翻引擎。
  • 技术主题多指标计算及趋势预测方法及装置-202111250505.X
  • 李玥;仇瑜;唐杰;刘德兵;褚晓泉 - 北京智谱华章科技有限公司
  • 2021-10-26 - 2022-01-28 - G06F40/44
  • 本发明提供了一种技术主题多指标计算及趋势预测的方法及装置,其中,该方法包括:获取多个论文文本数据,对多个论文文本数据的关键字段进行预处理操作,其中,关键字段包括:论文标题、摘要和关键词;根据预处理操作后的关键字段,进行多特征权重计算,采用LDA主题模型对加权后的多特征字段进行技术主题提取;基于提取的技术主题,设计多个衡量技术主题先进性的指标度量方法,并统计技术主题指标的指标值,其中,技术主题指标包括:强度、稳定度、新兴度、前沿度;基于指标值,采用Logistic模型对技术主题发展趋势进行预测,并做技术主题之间的对比分析。该方法提取文本多重特征,明确主题划分,形成了通用的技术主题指标计算和趋势预测方法。
  • 信息处理方法及其装置、同声翻译系统-201611031049.9
  • 姜里羊;王宇光;陈伟;程善伯 - 北京搜狗科技发展有限公司
  • 2016-11-16 - 2022-01-11 - G06F40/44
  • 本发明实施例提供了一种信息处理方法及其装置、同声翻译系统,其中的方法具体包括:获取讲话用户的语音信号对应的文本信息;依据所述文本信息所包含分句的信息,从所述文本信息中获取所述分句的信息符合预置条件的分句,作为当前需要进行机器翻译的目标分句;向机器翻译装置发送所述目标分句,以使所述机器翻译装置将所述目标分句信息翻译为目标语言的文字。本发明实施例可以对当前需要进行机器翻译的分句进行控制,以避免发送给机器翻译装置的句子过长或过短的情形,因此可以有效提高翻译的准确率和实时率。
  • 基于人工智能的翻译方法及装置-202110722179.1
  • 颜建昊;孟凡东 - 腾讯科技(深圳)有限公司
  • 2021-06-28 - 2021-12-21 - G06F40/44
  • 本申请提供了一种基于人工智能的翻译方法及装置;方法包括:将待翻译语句中的第i个元素编码为第i向量,并将第i向量与翻译词表进行匹配,得到多个中间向量;将多个中间向量分别与待翻译语句的前i‑1个元素的候选翻译向量进行融合处理,并对得到的多个融合后的候选翻译向量进行概率预测处理,得到每个候选翻译向量的条件概率;将对应的条件概率不小于下界概率的候选翻译向量存储至数据结构中,其中,数据结构中存储有前i次翻译过程中对应的条件概率大于下界概率的K个候选翻译向量;将数据结构中的候选翻译向量进行解码,得到待翻译语句前i个元素的翻译结果。通过本申请,能够精确搜索出准确的翻译结果。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top