[发明专利]声音识别服务器综合装置以及声音识别服务器综合方法有效
申请号: | 201380018950.0 | 申请日: | 2013-04-03 |
公开(公告)号: | CN104221078B | 公开(公告)日: | 2016-11-02 |
发明(设计)人: | 大渊康成;本间健 | 申请(专利权)人: | 歌乐株式会社 |
主分类号: | G10L15/32 | 分类号: | G10L15/32;G10L15/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 赵琳琳 |
地址: | 日本国*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供以最佳形式对通用声音识别服务器的声音识别结果和专用声音识别服务器的声音识别结果进行综合从而最终错误较少的声音识别功能。使用包含在用户辞典数拥中的语句来构建专用的声音识别服务器(108),并且使用这些数拥来事前评价通用的声音识别服务器(106)的性能。以该评价结果为基础,对从专用以及通用的声音识别服务器得到的识别结果,将采用哪个、对它们进行怎样的加权才能得到最佳的识别结果作为结果综合用参数(118),以数据库的形式保持。在识别执行时,通过将专用以及通用的声音识别服务器进行识别的识别结果与结果综合用参数(118)进行比较,由此来获得最佳的识别结果。 | ||
搜索关键词: | 声音 识别 服务器 综合 装置 以及 方法 | ||
【主权项】:
一种声音识别服务器综合装置,是对用于用户使用声音来进行操作的终端装置、与识别声音数据并返回其结果的声音识别服务器之间进行中继的装置,其特征在于,所述声音识别服务器综合装置具备:基于用户所登记的语句或用户经常使用的语句的列表来学习并保存识别结果综合用参数的综合方式学习部;从所述终端装置接收用户为了声音识别而刻意发出的声音的数据的单元;将所述接收到的声音数据发送给通用声音识别服务器以及专用声音识别服务器的单元;接收所述通用声音识别服务器以及专用声音识别服务器对所述声音数据进行识别的识别结果的单元;将所述通用声音识别服务器以及专用声音识别服务器进行识别的识别结果与所述保存的识别结果综合用参数进行比较来选择最佳的识别结果的识别结果综合部;将所述选择的识别结果发送给所述终端装置的单元;从所述终端装置接收用户所登记的语句或用户经常使用的语句的列表的单元;以所述接收到的语句为基础来生成合成声音的声音合成部;将所述生成的合成声音发送给所述通用声音识别服务器以及专用声音识别服务器的单元;和接收所述通用声音识别服务器以及专用声音识别服务器对所述合成声音进行识别的识别结果的单元,所述综合方式学习部将成为所述合成声音的基础的语句和所述识别结果一起进行解析,学习并保存识别结果综合用参数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于歌乐株式会社,未经歌乐株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201380018950.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种枸杞珍酒的制备方法
- 下一篇:一种防衰老美肤的手工香皂
- 同类专利
- 一种基于AR设备的语音识别方法及系统-201910841013.4
- 高巍 - 上海擎测机电工程技术有限公司
- 2019-09-03 - 2019-11-12 - G10L15/32
- 本发明公开了一种基于AR设备的语音识别方法,其包括如下步骤:S1:采集现场的语音信号;S2:查询当前是否有网络,若有则跳转至S3,若无则跳转至S7;S3:将语音信号上传至云端服务器进行识别分析并输出在线识别结果,同时在本地AR装置上识别分析并输出本地识别结果;S4:分别对在线识别结果和本地识别结果进行评分运算求得在线分析得分和本地分析得分;S5:在线分析得分与本地分析得分进行比例运算、当比例值大于阈值时,跳转至S6;当比例值小于阈值时,跳转至S7;S6:将在线识别结果反馈至本地AR装置进行播放;S7:本地AR装置播放本地识别结果。本发明能够提升语音识别的响应速度,简化用户的控制操作,提升用户语音控制的准确度。
- 一种基于深度学习技术的自动口音分类方法及装置-201511021329.7
- 刘文举;陈明明;张邯平;高鹏;董理科;刘晓飞;乔利玮;王桐 - 中国科学院自动化研究所;国网山西省电力公司电力科学研究院;山西振中电力股份有限公司
- 2015-12-30 - 2019-09-03 - G10L15/32
- 本发明公开了一种基于深度学习技术的自动口音分类方法和装置,方法包括:对训练集中的所有带口音语音进行去除静音并提取MFCC特征;根据所提取的MFCC特征训练各种带口音语音的深层神经网络,以描述各种带口音语音的声学特性,其中所述深层神经网络指至少包含两个隐层的前向人工神经网络;计算待识别语音中各语音帧在深层神经网络上的各口音分类的概率得分,将概率得分最大的口音类别标签置为该语音帧的口音类别标签;使用待识别语音中的每个语音帧的口音类别进行多数投票,得到待识别语音相对应的口音类别。本发明可以有效利用上下文信息,从而可以提供比传统浅层模型更好的分类效果。
- 声音识别处理装置、声音识别处理方法以及显示装置-201480057905.0
- 小金井智弘;小沼知浩 - 松下知识产权经营株式会社
- 2014-12-22 - 2019-08-30 - G10L15/32
- 本发明提供一种声音识别处理装置、声音识别处理方法以及显示装置,提升声音操作的操作性。为此,在声音识别处理装置(100)中,声音处理部(102)将声音信息变换为指令信息。声音识别部(50)将声音信息变换为字符串信息。意图解释处理部(104)从字符串信息之中筛选保留字信息和自由字信息。存储部存储指令信息、保留字信息以及自由字信息。搜索处理部(107)执行基于指令信息、保留字信息以及自由字信息的搜索处理。若指令信息、保留字信息以及自由字信息之中有一个或者两个不足信息,则搜索处理部(107)从存储部(170)之中读出该不足信息来执行搜索处理。
- 用于语音识别的电子装置和方法-201480047495.1
- 李相勋;姜赫;金炅泰;诸成民;郑晳荣 - 三星电子株式会社
- 2014-08-26 - 2019-08-30 - G10L15/32
- 本发明涉及一种用于改变动态屏幕布局的方法和电子装置。根据本发明的各种实施例的使用电子装置的方法可包括如下步骤:第一语音识别装置和第二语音识别装置中的一个或更多个装置获取第一语音;当预定命令被包括在由第一语音识别装置获取的第一语音中时,通过外部电子装置来识别额外识别的第二语音;当预定命令被包括在由第二语音识别装置获取的第一语音中时,识别额外识别的第二语音;并且基于识别的第二语音来执行相关的操作。
- 语音识别方法、装置、设备和存储介质-201910327337.6
- 骆彬;彭学政;涂润;陈召 - 腾讯科技(深圳)有限公司
- 2019-04-23 - 2019-08-20 - G10L15/32
- 本申请提供了一种语音识别方法、装置、设备和存储介质。所述方法包括:获取待识别的语音数据;将待识别的语音数据发送给n个语音识别引擎,得到n个语音识别结果,n为大于1的整数;根据n个语音识别结果的特征信息,从n个语音识别结果中选择目标语音识别结果。本申请提供的技术方案中,采用多个语音识别引擎的语音识别结果作为参考,并从多个语音识别结果中选取较优的语音识别结果,提高了识别结果的准确度。
- 机器人语音处理方法及装置、云端服务器-201910114891.6
- 支涛;王洪贺 - 安徽云之迹信息技术有限公司
- 2019-02-14 - 2019-06-28 - G10L15/32
- 本申请公开了一种机器人语音处理方法及装置、云端服务器。该方法包括获取通过机器人采集的音频数据;转发所述音频数据至多个语音服务提供商服务器数据接口进行处理;以及接收由多个所述语音服务提供商服务器数据接口返回的对所述音频数据的语义识别结果并按照预设优先级选择出所述语义识别结果后下发。本申请解决了机器人对于语音处理时速度较慢的技术问题。通过本申请结合多个语音服务商平台的语音语义处理结果,从中选择语义结果更为准确的结果和更为及时的结果,从而在速度上和准确度上达到更符合用户预期的反馈。
- 声音识别系统以及声音识别方法-201480080290.3
- 杉谷直哉;冈登洋平;山崎道弘 - 三菱电机株式会社
- 2014-07-08 - 2018-07-06 - G10L15/32
- 本发明的目的在于提供一种能在抑制无用处理的同时,获得妥当性较高的识别效果的技术。声音识别装置(1)包括第1~第3声音识别部(11~13)及控制部(14)。控制部(14)在基于由第1及第2声音识别部(11、12)获取的识别结果,判定为使第3声音识别部(13)识别输入声音的情况下,利用包含由第1及第2声音识别部(11、12)中的至少一方获取的候补字符串的词典,使第3声音识别部(13)识别输入声音。
- 智能机器人及其云端交互方法、云端交互系统-201510638795.3
- 不公告发明人 - 深圳光启合众科技有限公司
- 2015-09-30 - 2017-04-12 - G10L15/32
- 本发明提供一种具有云端交互功能的智能机器人,包括机器人本体,以及在机器人本体上设置的语音输入单元、口令识别处理单元、云端识别单元、主控单元和执行机构,主控单元控制执行云端识别单元和口令识别处理单元,并根据识别处理结果驱动执行机构执行动作或给出提示信息。智能机器人会根据云端识别和口令识别的之一的执行结果,确定是否执行另一个识别单元。本发明提供的智能机器人、云端识别方法和云端交互系统,集成了离线的口令识别处理和云端在线识别处理两种功能,并能够根据实际场景或其他策略确定适用的识别处理单元以及顺序,扩展了语音识别适用范围,同时在云端识别中增加了语音识别和语义理解,提高了机器人的智能性。
- 语音识别的车载终端及其方法-201610969587.6
- 陈宏州 - 湖南海翼电子商务股份有限公司
- 2016-11-04 - 2017-02-08 - G10L15/32
- 本发明涉及一种语音识别的车载终端及其方法。该车载终端包括麦克风,用于收集语音信息;通信单元,用于将语音信息发送至云端服务器,并接收云端服务器对语音信息进行识别后获得的第二语音识别结果;存储器,用于存储应用程序、从麦克风接收的语音信息;处理器,用于运行存储于存储器中的应用程序,对语音信息进行解析和识别得到第一语音识别结果;对第一语音识别结果和第二语音识别结果进行仲裁,确定最终的语音识别结果,并根据最终的语音识别结果并生成相应控制指令。通过本发明可以保证识别率和识别速度,解决车载终端内存与语音识别的网络资源问题。
- 一种基于云计算与置信度计算的语音识别方法与系统-201610840519.X
- 李志;田宗贵 - 广东工业大学
- 2016-09-21 - 2017-01-18 - G10L15/32
- 本发明公开了一种基于云计算与置信度计算的语音识别方法,涉及语音识别的技术领域,包含以下步骤S1、本地语音识别系统和云端语音识别系统分别接收语音信号;S2、本地语音识别系统得出本地语音识别结果,云端语音识别系统得出云端语音识别结果;S31、对本地语音识别结果进行置信度评测,得出本地语音识别结果的置信度;S32、对云端语音识别结果进行置信度评测,得出云端语音识别结果的置信度;S4、将本地语音识别结果的置信度与云端语音识别结果的置信度进行比较,输出置信度较高的语音识别结果。本发明还公开了一种基于云计算与置信度计算的语音识别系统。本发明采用云端与本地语音识别相结合的方法,可提高语音识别的质量。
- 语音识别方法及系统-201610465607.6
- 林瑞华;黎琛 - 东莞酷派软件技术有限公司
- 2016-06-21 - 2016-11-16 - G10L15/32
- 本发明提供了一种语音识别方法,应用于电子设备中,该方法包括:获取用户输入的语音信息;利用第一语音识别方法识别所述语音信息得到第一语音识别结果,利用第二语音识别方法识别所述语音信息得到第二语音识别结果,其中,所述第一语音识别方法和第二语音识别方法是并行运行的;及根据预先设置的规则显示所述第一语音识别结果及所述第二语音识别结果。本发明还提供一种语音识别系统。利用本发明,能够利用所述第二语音识别方法辅助所述第一语音识别方法识别用户的语音信息,提高了语音识别率。
- 声音识别服务器综合装置以及声音识别服务器综合方法-201380018950.0
- 大渊康成;本间健 - 歌乐株式会社
- 2013-04-03 - 2016-11-02 - G10L15/32
- 提供以最佳形式对通用声音识别服务器的声音识别结果和专用声音识别服务器的声音识别结果进行综合从而最终错误较少的声音识别功能。使用包含在用户辞典数拥中的语句来构建专用的声音识别服务器(108),并且使用这些数拥来事前评价通用的声音识别服务器(106)的性能。以该评价结果为基础,对从专用以及通用的声音识别服务器得到的识别结果,将采用哪个、对它们进行怎样的加权才能得到最佳的识别结果作为结果综合用参数(118),以数据库的形式保持。在识别执行时,通过将专用以及通用的声音识别服务器进行识别的识别结果与结果综合用参数(118)进行比较,由此来获得最佳的识别结果。
- 语音检索装置和语音检索方法-201480074908.5
- 花泽利行 - 三菱电机株式会社
- 2014-02-06 - 2016-09-28 - G10L15/32
- 具有:识别部(2),其参照声学模型和学习数据不同的多个语言模型来进行输入语音的语音识别,针对多个语言模型取得识别文字串;文字串对照部(6),其对照多个语言模型的各个语言模型的识别文字串与蓄积在文字串词典存储部(7)所存储的文字串词典中的检索对象词汇的文字串,计算表示识别文字串相对于检索对象词汇的文字串的一致度的文字串对照分数,针对识别文字串分别取得文字串对照分数最高的检索对象词汇的文字串和该文字串对照分数;以及检索结果确定部(8),其参照所取得的所述文字串对照分数,按照该文字串对照分数从高到低的顺序将1个以上的检索对象词汇作为检索结果而输出。
- 一种基于最小堆的路径存储方法、系统和语音识别器-201610229193.7
- 王彪 - 乐视控股(北京)有限公司;乐视致新电子科技(天津)有限公司
- 2016-04-13 - 2016-08-31 - G10L15/32
- 本发明提供了一种基于最小堆的路径存储方法、系统和语音识别器,该方法和系统应用于语音识别器。具体步骤为首先初始化所述语音识别器识别出的活动路径;将初始化后的活动路径向后扩展一帧至所有可能达到的路径;将所有活动路径中打分靠前的预设数量的活动路径保存到一个预设的最小堆中;对最小堆进行倒序拷贝。通过最小堆保存活动路径的手段,能够使操作的复杂度从O(n)降低为O(logn),从而能够相应提高语音识别的效率。
- 具有云端交互功能的智能机器人-201520774370.0
- 不公告发明人 - 深圳光启合众科技有限公司
- 2015-09-30 - 2016-08-24 - G10L15/32
- 本实用新型提供一种具有云端交互功能的智能机器人,包括机器人本体,以及在机器人本体上设置的语音输入单元、口令识别处理单元、云端识别单元、主控单元和执行机构,主控单元控制执行云端识别单元和口令识别处理单元,并根据识别处理结果驱动执行机构执行动作或给出提示信息。智能机器人会根据云端识别和口令识别的之一的执行结果,确定是否执行另一个识别单元。本实用新型的智能机器人和云端交互系统,集成了离线的口令识别处理和云端在线识别处理两种功能,并能够根据实际场景或其他策略确定适用的识别处理单元以及顺序,扩展了语音识别适用范围,同时在云端识别中增加了语音识别和语义理解,提高了机器人的智能性。
- 一种语音识别的方法及系统-201610065010.2
- 谷树森 - 深圳市尔木科技有限责任公司
- 2016-01-30 - 2016-06-29 - G10L15/32
- 本发明公开一种语音识别的方法及系统,目的在于解决语音识别系统不能大规模应用于智能硬件的不足,其包括以下步骤:获取语音数据;通过命令词识别模块识别所述语音数据,若所述命令词识别模块识别出所述语音数据,则输出所述命令词识别模块识别的语音数据结果;若否,则输入至听写识别模块;通过听写识别模块识别所述输入至听写识别模块的语音数据,并获得最终的语音数据结果。该一种语音识别的方法及系统通过在语音输入后首先进行命令词识别,如果命令词识别未识别出再进行听写识别,最后给出识别结果,在一定程度上扩大了语音识别系统在智能硬件上应用规模。
- 一种语音识别方法及语音识别装置-201510666620.3
- 徐波 - 桂林电子科技大学
- 2015-10-15 - 2016-01-06 - G10L15/32
- 本发明公开了一种语音识别方法及语音识别装置,语音识别方法包括:录入用户的声音信息;获取用户所在的位置信息,并分析录入声音信息的特性以获取用户的场景信息;根据用户所在的位置信息确定对应的区域信息,并调用与该区域信息对应的语音数据库和语法数据库,对用户的声音信息进行识别,得到第一语音识别结果;根据用户的场景信息匹配语法模型或语言模型,并进行模式匹配算法对用户的声音信息进行识别,得到第二语音识别结果;对所述第一语音识别结果和所述第二语音识别结果进行整合,得到最终的语音识别结果,并输出该语音识别结果。通过本发明,能够根据声音信息所处的区域信息和场景信息,对声音信息进行识别,提高语音识别的准确性。
- 语音识别装置-201280076811.9
- 古本友纪 - 三菱电机株式会社
- 2012-11-05 - 2015-07-01 - G10L15/32
- 根据本发明的语音识别装置,即使是在始终对说出的语音进行识别的情况下,也能够接受语音识别开始指示的操作,因此能够避免因每次识别都需要进行特定操作所带来的麻烦,而且在说话人希望的情况下,能够通过语音识别开始指示的操作,利用识别率更高的语音识别方法来进行识别,从而能够提高便利性。
- 专利分类