[发明专利]语音识别系统以及语音识别装置有效
申请号: | 201380073708.3 | 申请日: | 2013-11-20 |
公开(公告)号: | CN105027198B | 公开(公告)日: | 2018-11-20 |
发明(设计)人: | 小川勇;花泽利行;成田知宏 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G10L15/32 | 分类号: | G10L15/32;G10L15/10;G10L15/183;G10L15/30 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉;黄纶伟 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 具有:识别结果候选比较部(205),其对接收部(204)接收到的多个服务器侧语音识别结果候选进行比较,检测有差异的文本;识别结果综合部(206),其根据客户端侧语音识别结果候选、服务器侧语音识别结果候选以及识别结果候选比较部(205)的检测结果,综合客户端侧语音识别结果候选和服务器侧语音识别结果候选,确定语音识别结果。 | ||
搜索关键词: | 语音 识别 系统 以及 装置 | ||
【主权项】:
1.一种语音识别系统,其特征在于,该语音识别系统具有服务器装置以及与所述服务器装置连接的客户端侧的语音识别装置,所述服务器装置具有:服务器侧接收部,其接收从所述语音识别装置输入的语音数据;服务器侧语音识别部,其进行所述服务器侧接收部接收到的语音数据的语音识别,生成服务器侧语音识别结果候选;以及服务器侧发送部,其向所述语音识别装置发送所述服务器侧语音识别部所生成的所述服务器侧语音识别结果候选,所述语音识别装置具有:语音输入部,其将所输入的发声语音转换成所述语音数据;客户端侧语音识别部,其进行所述语音输入部所转换的所述语音数据的语音识别,生成客户端侧语音识别结果候选;客户端侧发送部,其向所述服务器装置发送所述语音输入部所转换的所述语音数据;客户端侧接收部,其接收所述服务器侧发送部所发送的所述服务器侧语音识别结果候选;识别结果候选比较部,其对所述客户端侧接收部接收到的多个所述服务器侧语音识别结果候选进行比较,检测有差异的文本;识别结果综合部,其根据所述客户端侧语音识别结果候选、所述服务器侧语音识别结果候选以及所述识别结果候选比较部的检测结果,综合所述客户端侧语音识别结果候选和所述服务器侧语音识别结果候选,确定语音识别结果;以及输出部,其输出所述识别结果综合部所确定的语音识别结果,所述识别结果综合部以所述有差异的文本为基准对所述服务器侧语音识别结果候选的文本进行分割,将所分割的文本和所述客户端侧语音识别结果候选的文本结合,确定语音识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201380073708.3/,转载请声明来源钻瓜专利网。
- 同类专利
- 外源性大词汇量模型到基于规则的语音识别的合并-201580004735.4
- T·威尔逊;S·夸齐;J·维孔多阿;P·法特普里亚 - 微软技术许可有限责任公司
- 2015-01-12 - 2019-11-05 - G10L15/32
- 提供了外源性大词汇量模型到基于规则的语音识别的合并。音频流由本地小词汇量、基于规则的语音识别系统(SVSRS)接收,并被传输至大词汇量的、基于统计模型的语音识别系统(LVSRS)。SVSRS和LVSRS对音频执行识别。如果一部分音频没有被SVSRS识别,则触发这样的规则:将标记插入到识别结果中。将该识别结果发送至LVSRS。如果检测到标记,则对音频的指定的一部分执行识别。LVSRS结果与SVSRS结果进行统一并作为混合响应发送回SVSRS。如果没有触发混合识别规则,则唤起仲裁算法来确定是SVSRS识别还是LVSRS识别具有更小的词语错误率。将所确定的识别作为响应发送至SVSRS。
- 多识别器语音识别-201480027534.1
- 彼塔尔·阿列克西克;佩德罗·J·莫雷诺门希瓦尔;法迪·比亚德希 - 谷歌有限责任公司
- 2014-04-18 - 2019-10-29 - G10L15/32
- 本说明书的主题可具体体现为方法等,该方法包括接收与发声相对应的音频数据,获得使用有限语音识别器所产生的发声的第一转录。有限语音识别器包括包含通过有限语音识别词汇所训练的语言模型的语音识别器,所述有限语音识别词汇包括来自语音命令语法的一个或多个项,但包括比扩展语法的所有项少。获得使用扩展语音识别器所产生的发声的第二转录。扩展语音识别器包括包含通过扩展语音识别词汇所训练的语言模型的语音识别器,所述扩展语音识别词汇包括扩展语法的所有项。至少基于第一转录或第二转录的一部分来对发声进行分类。
- 语音识别系统以及语音识别装置-201380073708.3
- 小川勇;花泽利行;成田知宏 - 三菱电机株式会社
- 2013-11-20 - 2018-11-20 - G10L15/32
- 具有:识别结果候选比较部(205),其对接收部(204)接收到的多个服务器侧语音识别结果候选进行比较,检测有差异的文本;识别结果综合部(206),其根据客户端侧语音识别结果候选、服务器侧语音识别结果候选以及识别结果候选比较部(205)的检测结果,综合客户端侧语音识别结果候选和服务器侧语音识别结果候选,确定语音识别结果。
- 将来自各种语音服务的结果表示为统一概念知识库-201680080451.8
- M·N·A·乔治斯;F·E·A·奈特恩;J·D·阿纳斯塔西亚迪斯;O·本德尔;J·M·德克罗斯 - 纽昂斯通讯公司
- 2016-05-31 - 2018-10-23 - G10L15/32
- 描述了用于处理来自多个语音服务的结果的系统和方法。一种方法包括:接收来自多个语音服务的语音服务结果和与语音服务结果对应的服务规范。结果为表示根据语音服务的功能的信息的至少一种数据结构。服务规范描述数据结构及针对各语音服务该数据结构的解释。基于服务规范将语音服务结果编码成结果的统一概念知识表示。向应用模块提供统一概念知识表示。方法包括:评估从多个语音服务异步接收的语音服务结果,以基于可靠性测度来确定所接收的语音服务结果中是否存在可靠结果。如果存在可靠结果,则将可靠结果提供给应用模块;否则,方法继续评估所接收的语音服务结果。
- 多遍车辆语音识别系统和方法-201380043053.5
- S·M·帕娜因特;D·J·休斯 - 威斯通全球技术公司
- 2013-06-21 - 2018-06-15 - G10L15/32
- 用于车辆的语音识别系统包括用于接收来自用户的话语的麦克风。所述系统还包括存储器,所述存储器具有用于语音识别的命令或名称的部分集合。所述存储器还包括用于语音识的命令或名称的较大集合。所述系统还包括与所述麦克风和所述存储器通信的处理电子器件。所述处理电子器件被配置为处理所接收到的话语以获得话语数据。所述处理电子器件进一步被配置为使用所获得的语音数据以进行至少两遍语音识别。在第一遍中,将话语数据与部分集合进行比较。在第二遍中,将话语数据与较大集合进行比较。 1
- 机动车中的语音识别-201380053806.0
- G·格吕沙尔斯基;T·坎切瓦 - 奥迪股份公司;大众股份公司
- 2013-05-18 - 2017-06-06 - G10L15/32
- 本发明涉及一种用于在机动车(10)中进行语音识别的方法。接收用户(22)的语音输入(26),在不向用户(22)提出询问的情况下将至少一个所接收的语音输入传输给车辆内部的车载‑语音识别器(46)。由此产生第一识别结果(48),但该第一识别结果并不总是正确的,因此需要询问用户或由用户作出校正。本发明的目的在于,在机动车(10)中提供可靠的语音识别,其使得机动车中的用户尽可能少地从交通现状中分心。为此,由处理装置(32)将语音输入(54)全部或部分地也传输给车辆外部的非车载‑语音识别器(12),并由处理装置(32)从该非车载‑语音识别器接收第二识别结果(56),由处理装置(32)根据第一识别结果(48)和第二识别结果(56)确定语言文本(34)。
- 用于产生控制命令的方法和系统-201480069564.9
- W·哈伯尔;K·科纳贝尔 - 宝马股份公司
- 2014-12-19 - 2016-08-03 - G10L15/32
- 本发明涉及一种用于由口头表达产生控制命令(B)的方法,该口头表达包含自由措辞和使用者特定的术语,该方法包括如下步骤:a)通过记录装置(11)将包括多个单词(W)的语音命令记录(1)为音频数据流;b)通过网络(20)发送(2)音频数据流给第一语音识别装置(31);c)由第一语音识别装置(31)接收(5)至少一个数据包,其中,所述数据包包含如下信息(I):哪些单词(W)在音频数据流中未被识别出;d)通过第二语音识别装置(16)在使用至少一个数据库的情况下至少部分识别(7)未被第一语音识别装置(31)识别的单词(W);e)将第一语音识别装置(31)和第二语音识别装置(16)的结果组合(8)为控制命令(B);以及f)输出控制命令(B)。
- 语音识别装置和语音识别方法-201380074221.7
- 花泽利行 - 三菱电机株式会社
- 2013-03-06 - 2015-10-28 - G10L15/32
- 语音识别装置(1)在内部识别部(7)中,对输入语音(2)的语音数据(4)进行使用了声学模型(9)的识别处理,求出内部识别结果(10)和声学似然度。读音赋予部(12)取得由外部识别部(19)对输入语音(2)的语音数据(4)进行识别处理后的外部识别结果(11),对该语音数据(4)赋予读音,重新对照部(15)使用声学模型(9),求出外部识别结果(11)的声学似然度,作为重新对照结果(16)。结果确定部(17)对内部识别结果(10)的声学似然度、和重新对照结果(16)所包含的外部识别结果(11)的声学似然度进行比较,确定最终识别结果(18)。
- 声音识别装置-201380019801.6
- 山室庆太;冈登洋平 - 三菱电机株式会社
- 2013-11-29 - 2015-08-05 - G10L15/32
- 本发明的声音识别装置包括:声音识别部(2),该声音识别部(2)由能识别预先确定的字串的第一识别引擎、及能识别所述字串的一部分的第二识别引擎构成;以及判定部(4),该判定部(4)基于作为第一及第二识别引擎(2a、2b)的声音识别的识别结果的、第一及第二识别结果候选的时间长度之差,来从第一及第二识别结果候选中采用一个或多个可能的识别结果候选。
- 专利分类