[发明专利]音频信号处理装置及噪声抑制方法在审
申请号: | 201980066410.7 | 申请日: | 2019-08-23 |
公开(公告)号: | CN112889110A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 难波隆一;见山成志;真锅芳宏;及川芳明 | 申请(专利权)人: | 索尼公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0208;H04R1/40;H04R3/00 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 吴孟秋 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明的目的是通过进行适合于噪声环境的噪声抑制来提高噪声抑制性能。获取噪声字典数据,噪声字典数据是基于包括与声音接收点和噪声源之间的方向以及噪声类型有关的信息的安装环境信息从噪声数据库中读取的。所获取的噪声字典数据用于对由布置在声音接收点的麦克风所获取的音频信号进行噪声抑制处理。 | ||
搜索关键词: | 音频 信号 处理 装置 噪声 抑制 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201980066410.7/,转载请声明来源钻瓜专利网。
- 同类专利
- 语音识别系统-201880015644.4
- 渡部晋治;落合翼;堀贵明;J·R·赫尔歇 - 三菱电机株式会社
- 2018-02-23 - 2023-10-13 - G10L21/0216
- 一种语音识别系统包括接收包括语音信号的声信号的多个麦克风;从声信号生成多通道输入的输入接口;存储多通道语音识别网络的一个或多个储存器,其中,多通道语音识别网络包括从多通道输入生成时间‑频率掩模的掩模估计网络;被训练为使用时间‑频率掩模从多通道输入中选择基准通道输入并且基于基准通道输入生成增强语音数据集的波束形成器网络;以及被训练为将增强语音数据集变换为文本的编码器‑解码器网络。系统还包括与一个或多个储存器关联地使用多通道语音识别网络以从多通道输入生成文本的一个或多个处理器;和渲染文本的输出接口。
- 多信道语音活动检测-202180086803.1
- 诺兰·安德鲁·米勒;莱明·迈赫兰 - 谷歌有限责任公司
- 2021-10-21 - 2023-08-22 - G10L21/0216
- 一种用于多信道语音活动检测的方法(800)包括接收表征由麦克风阵列(106)捕获的流式多信道音频(118)的输入帧序列(164)。所述流式多信道音频的每个信道(119)包括由单独专用麦克风捕获的各自的音频特征(162)。所述方法还包括使用位置指纹模型(120)确定位置指纹(124),所述位置指纹(124)基于所述各自的音频特征来指示多信道音频的源相对于用户设备(102)的位置。所述方法还包括来自特定应用分类器(130)生成输出。所述第一分数(134)指示多信道音频对应于特别音频类型的可能性。所述方法还包括基于作为来自所述特定应用分类器的输出而生成的第一分数确定是否接受或拒绝由特定应用处理的所述多信道音频。
- 针对遍布式聆听插入强制间隙-202180081473.7
- C·G·海恩斯;B·J·索斯威尔 - 杜比实验室特许公司
- 2021-12-02 - 2023-08-04 - G10L21/0216
- 衰减或“间隙”可以在至少第一时间间隔期间被插入到内容流的至少第一和第二音频回放信号的至少第一频率范围中以生成至少第一和第二修改音频回放信号。对应的音频设备回放声音可以由至少第一和第二音频设备提供。至少一个麦克风可以检测至少第一音频设备回放声音和第二音频设备回放声音并且可以生成对应的麦克风信号。可以至少在第一频率范围中从麦克风信号中提取音频数据,以产生提取的音频数据。可以至少部分地基于提取的音频数据来估计远场音频环境脉冲响应和/或音频环境噪声。
- 语音增强方法及装置-201880067882.X
- 胡伟湘;苗磊 - 华为技术有限公司
- 2018-01-18 - 2022-12-27 - G10L21/0216
- 一种语音增强方法及装置,方法包括:根据带噪语音信号的功率谱以及噪声信号的功率谱,确定第一谱减参数(S201);根据第一谱减参数以及参考功率谱确定第二谱减参数(S202);根据噪声信号的功率谱和第二谱减参数对带噪语音信号进行谱减处理(S203);其中,参考功率谱包括:用户语音预测功率谱和/或环境噪声预测功率。通过考虑到终端设备的用户语音功率谱特性和/或用户所处环境噪声功率谱特性的规律性,对第一谱减参数进行优化处理得到第二谱减参数,以便根据优化后的第二谱减参数对带噪语音信号进行谱减处理,提高了去噪后的语音信号的可懂度和自然度,从而提高了降噪性能。
- 用于风噪声衰减的方法及装置-202180010243.1
- 宋建鸣 - 大陆汽车系统公司
- 2021-01-22 - 2022-08-19 - G10L21/0216
- 描述了从在多麦克风阵列处捕获的音频信号中检测和降低风噪声的方法。在一些方面,风噪声检测器是根据话音存在的概率和风噪声存在的概率构建的,所述概率是从分离的频率区域中在多麦克风的时间对齐信号之间的相位差的统计数据导出的。如果检测到风噪声,则在频域中通过增益降低风噪声,所述增益也是相位差及其统计数据的函数。
- 区分语音命令-202080049611.9
- E·李;D·T·古宁顿;G·G·彻瑞拉;J·J·伍德 - 国际商业机器公司
- 2020-08-13 - 2022-02-25 - G10L21/0216
- 本公开的各方面涉及语音命令过滤。与位于一位置处的语音控制设备建立通信。从语音控制设备接收指示被阻挡方向的数据。接收语音命令。确定该语音命令是从数据中指示的被阻挡方向接收到的。然后忽略接收到的语音命令。
- 使用半盲自适应滤波器模型的通信终端的声学击键瞬态消除器-201680034279.2
- 赫伯特·巴克纳;西蒙·J·戈德席尔;简·斯科格隆 - 谷歌有限责任公司
- 2016-10-18 - 2022-01-11 - G10L21/0216
- 提供了使用半盲自适应滤波器模型的用于用户通信设备的声学击键瞬态消除/抑制的方法和系统。该方法和系统被设计用于通过考虑一些较少缺陷的信号作为瞬态的边信息来克服在瞬态噪声抑制中存在的问题,并且还使用动态模型来考虑声学信号传播(包括回声效应)。该方法和系统利用嵌入在用户设备的键盘中的同步参考麦克风,并且采用利用该键座麦克风信号的知识的自适应滤波方法。
- 用于控制降噪的装置、方法和计算机程序-201980092414.2
- M·维莱莫;J·马基宁;J·维卡莫 - 诺基亚技术有限公司
- 2019-12-13 - 2021-09-28 - G10L21/0216
- 本公开的示例涉及用于控制包括由多个麦克风捕获的音频的音频信号中的降噪的装置、方法和计算机程序。所述装置包括用于以下的模块:获得一个或多个音频信号,其中所述一个或多个音频信号包括由多个麦克风捕获的音频,以及将获得的一个或多个音频信号划分为多个区间。所述模块还可被配置为确定与不同区间的一个或多个噪声特性相关的一个或多个噪声特性相关的一个或多个参数,以及基于在不同区间内确定的一个或多个参数来控制用于不同区间的降噪。
- 音频信号处理装置及噪声抑制方法-201980066410.7
- 难波隆一;见山成志;真锅芳宏;及川芳明 - 索尼公司
- 2019-08-23 - 2021-06-01 - G10L21/0216
- 本发明的目的是通过进行适合于噪声环境的噪声抑制来提高噪声抑制性能。获取噪声字典数据,噪声字典数据是基于包括与声音接收点和噪声源之间的方向以及噪声类型有关的信息的安装环境信息从噪声数据库中读取的。所获取的噪声字典数据用于对由布置在声音接收点的麦克风所获取的音频信号进行噪声抑制处理。
- 用于全面收听的强加间隙插入-201980046995.6
- C·G·海因斯;G·N·狄金斯 - 杜比实验室特许公司
- 2019-07-26 - 2021-03-02 - G10L21/0216
- 一种全面收听方法,包括以下步骤:在回放信号中插入至少一个强加间隙(从而生成经修改的回放信号),并且在所述经修改的回放信号的回放期间,使用回放环境中麦克风的输出来监测所述回放环境中的非回放内容(例如,包括通过生成背景噪声估计)。可选地,所述方法包括生成所述回放信号,包括通过使用监测非回放内容的结果(例如,背景噪声估计)对输入信号进行处理(例如,执行噪声补偿)。其他方面是被配置为执行所述全面收听方法的任何实施例的系统。
- 用于远端电信的声学车厢内噪声消除系统-201880084708.6
- R.文顿;C.路德维格;G.H.乔根森;L.戈勒;M.莱多尔夫 - 哈曼国际工业有限公司
- 2018-12-31 - 2020-08-11 - G10L21/0216
- 一种车内噪声消除系统,可以优化远端用户体验。所述噪声消除系统可以结合来自车辆的实时声音输入以及来自电信装置的麦克风。来自安装在所述车辆中的小型嵌入式麦克风的音频信号可以经处理并混合成传出的电信信号,以有效地消除来自所述车辆中的一个或多个不想要的源的声能。多个麦克风可以安装到头枕并且在一个或多个方向上间隔开,以指示来自一个或多个听音区的传入的声音的方向,使得可以抑制来自某些区的声音。所述嵌入式麦克风捕获的不想要的噪声可以用作所述噪声消除系统的直接输入。作为直接输入,这些流因此可以从传出的电信信号中消除,从而向用户的远端通讯者提供更高的信噪比、通话质量和言语清晰度。
- 用于远端电信的声学车厢内噪声消除系统-201880084721.1
- R.温顿;C.路德维格;G.H.乔根森 - 哈曼国际工业有限公司
- 2018-12-27 - 2020-08-11 - G10L21/0216
- 一种车内噪声消除系统可优化远端用户体验。所述噪声消除系统可结合来自车辆的实时声音输入以及来自电信装置的麦克风。来自安装在所述车辆中的小型嵌入式麦克风的音频信号可被处理并混合成传出的电信信号,以有效地消除来自所述车辆中的一个或多个不想要的源的声能。除了被所述嵌入式麦克风捕获的不想要的噪声之外,从所述车辆的信息娱乐系统中的已知音频流播放的音频也可用作所述噪声消除系统的直接输入。作为直接输入,这些流因此可从所述传出的电信信号中消除,因而向用户的远端通讯者提供更高的信噪比、通话质量和言语清晰度。
- 使用视觉信息增强视频中人类说话者的语音信号的方法和系统-201880054901.5
- 施缪尔·潘莱格;阿萨夫·沙米尔;塔维·哈普林;阿维夫·加贝;阿里尔·艾弗拉特 - 耶路撒冷希伯来大学伊森姆研究发展有限公司
- 2018-07-03 - 2020-04-21 - G10L21/0216
- 本文提供了一种用于增强语音信号的方法和系统。该方法可以包括以下步骤:获得原始视频,其中该原始视频包括显示至少一个人类说话者面部的原始输入图像序列,以及与所述图像序列同步的原始声轨;以及使用计算机处理器处理原始视频,以基于从原始输入图像序列导出的视觉数据,通过检测与至少一个人类说话者的语音在听觉上无关的声音,产生所述至少一个人类说话者的增强语音信号。
- 键盘输入检测和抑制-201480005008.5
- J·E·N·克里斯滕森;S·J·戈德西尔;J·斯科格伦德 - 谷歌有限责任公司
- 2014-02-12 - 2019-06-04 - G10L21/0216
- 提供用于主要使用或仅使用传入音频数据检测音频流中瞬态噪音事件的方法和系统。此类方法提供经过改进的时间分辨率,且具有计算有效性。所述方法和系统使用音频信号的一些时频表示作为预测模型的基础,以尝试找到较远的瞬态噪音事件,并将真正的检测状态解释为隐马尔可夫模型(HMM),以便为瞬态噪音事件所共有的时序和频率内聚度建模。
- 专利分类