[发明专利]电子设备及其控制方法在审

专利信息
申请号: 201980052036.5 申请日: 2019-07-26
公开(公告)号: CN112513984A 公开(公告)日: 2021-03-16
发明(设计)人: 金昌汉;金宝元;李振硕;林贤泽;徐廷宽 申请(专利权)人: 三星电子株式会社
主分类号: G10L25/93 分类号: G10L25/93;G10L17/24;G10L15/22;G10L15/28;G10L15/16
代理公司: 中科专利商标代理有限责任公司 11021 代理人: 周祺
地址: 韩国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 本公开的电子设备包括:通信单元;存储器;以及处理器,其用于:在电子设备获取的音频信号中检测语音部分;识别在检测到的语音部分中包括的用户语音中是否存在存储于存储器中的唤醒词;当识别出在用户语音中存在唤醒词时,经由通信单元将用户语音发送到用于提供语音辨识服务的服务器;并且当从服务器接收到针对用户语音的响应信息时,基于接收到的响应信息提供对用户语音的响应,其中当用户语音的一部分与唤醒词匹配时,处理器识别出在用户语音中存在唤醒词。具体地,一种用于获取提供响应的自然语言的方法可以采用根据机器学习、神经网络和深度学习算法中的至少一种来学习的人工智能模型。
搜索关键词: 电子设备 及其 控制 方法
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201980052036.5/,转载请声明来源钻瓜专利网。

同类专利
  • 低复杂度的浊音语音检测和基音估计-201780095971.0
  • S·格拉夫;T·赫比格;M·布克 - 塞伦妮经营公司
  • 2017-08-17 - 2023-08-25 - G10L25/93
  • 公开了一种用于浊音语音检测和基音估计的低复杂度方法和设备,其能够对由诸如车内通信(ICC)系统等的需要低延时的应用给出的特殊约束进行处理。示例性实施例采用非常短的帧,该非常短的帧只能捕获音频信号中的浊音语音的单个激励脉冲。与基音周期相对应的、多个这种脉冲之间的距离可以通过评价非常短的帧的低分辨率谱之间的相位差来确定。示例性实施例可以基于相位差来直接在频域中进行基音估计,并通过避免变换到时域以进行基音估计来减少计算复杂度。在相位差被判断为大致呈线性的情况下,示例性实施例通过对音频信号应用语音增强来增强浊音语音的话音质量。
  • 一种NVOC低速窄带声码器的语音数据处理方法-202011049193.1
  • 肖文雄 - 天津联声软件开发有限公司
  • 2020-09-29 - 2023-03-28 - G10L25/93
  • 本发明涉及一种NVOC低速窄带声码器的语音数据处理方法,包括以下步骤:步骤1、编码端对原始语音数字信号的初始化配置和分析处理;步骤2、在步骤1计算得到的基音周期、清音和浊音数值参数的基础上继续对线谱对、基音值、增益参数、残差补偿增益、码本矢量等参数进行提取和量化;步骤3、提取步骤2的声音量化参数,通过该声音量化参数合成语音,经过压噪再提升语音质量,当参数恢复失败后或语音合成及后失败后进行声音重建。本发明能在低速率的情况下提供优良的语音质量。
  • 识别音频的方法、装置、设备、介质及产品-202111614630.4
  • 李文杰;高占杰;贾磊 - 北京百度网讯科技有限公司
  • 2021-12-27 - 2022-04-15 - G10L25/93
  • 本公开提供了一种识别音频的方法、装置、设备、介质及产品,涉及计算机技术领域,尤其涉及语音处理、深度学习、人工智能技术领域。具体实现方案为:对待识别音频进行声学特征预测,得到第一音频预测结果,以及用于预测音频识别结果的声学特征参考量;基于声学特征参考量,得到第二音频预测结果;基于第一音频预测结果以及第二音频预测结果,确定待识别音频的音频识别结果,音频识别结果包括清音或浊音。本公开能够在确定音频为清音或浊音时,利用对待识别音频进行声学特征预测得到的第一音频预测结果,并结合基于其他声学特征参考量得到第二音频预测结果,使对音频的清音或者浊音的判定结果更加准确,从而提高语音合成等语音处理中的音频质量。
  • 语音处理的清浊音判决方法及装置-201910358523.6
  • 高扬 - 华为技术有限公司
  • 2014-09-05 - 2021-08-13 - G10L25/93
  • 本发明实施例公开了一种判决语音信号的清音/浊音类型的方法及相关装置。确定反映语音信号的当前帧中的清音语音特性的清音参数,基于当前帧的前一帧的平滑后的清音参数来确定当前帧的平滑后的清音参数,计算当前帧的清音参数与平滑后的清音参数之间的相对差值,将所述计算得出的差值用作判决参数以确定所述当前帧是否为清音语音信号。
  • 一种清浊音检测方法、装置、设备及介质-202110105007.X
  • 张超鹏 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2021-01-26 - 2021-06-01 - G10L25/93
  • 本申请公开了一种清浊音检测方法、装置、设备、介质。该方法包括:提取待处理音频信号对应的功率谱;基于所述功率谱确定所述待处理音频信号中各个待处理音频信号子段的第一能量比,其中,各个所述待处理音频信号子段为基于所述待处理音频信号的采样频率对所述待处理音频信号进行划分得到的,所述第一能量比为各个所述待处理音频信号子段中的浊音频段内的能量与清浊音频段内的能量的比值,所述清浊音频段包括所述浊音频段和清音频段;根据所述第一能量比和预设能量比阈值确定出所述待处理音频信号中的清音片段和浊音片段。这样能够提高清浊音检测的正确率,且工作量较小,需要的成本较低。
  • 电子设备及其控制方法-201980052036.5
  • 金昌汉;金宝元;李振硕;林贤泽;徐廷宽 - 三星电子株式会社
  • 2019-07-26 - 2021-03-16 - G10L25/93
  • 本公开的电子设备包括:通信单元;存储器;以及处理器,其用于:在电子设备获取的音频信号中检测语音部分;识别在检测到的语音部分中包括的用户语音中是否存在存储于存储器中的唤醒词;当识别出在用户语音中存在唤醒词时,经由通信单元将用户语音发送到用于提供语音辨识服务的服务器;并且当从服务器接收到针对用户语音的响应信息时,基于接收到的响应信息提供对用户语音的响应,其中当用户语音的一部分与唤醒词匹配时,处理器识别出在用户语音中存在唤醒词。具体地,一种用于获取提供响应的自然语言的方法可以采用根据机器学习、神经网络和深度学习算法中的至少一种来学习的人工智能模型。
  • 基于希尔伯特包络谱的基音频率估计方法-202010944172.X
  • 王波;赵彦平;王海艳;李志军;胡封晔 - 吉林大学
  • 2020-09-10 - 2020-12-29 - G10L25/93
  • 本发明公开了一种基于希尔伯特包络谱的基音频率估计方法,克服了现有的基音频率估计方法在基音频率变化范围大时不能准确跟踪基音频率变化的问题,该基音频率估计方法包括的步骤为:1)输入语音信号:输入的语音信号用s[n]表示,采样频率fs,为减少低频偏差,利用y[n]=s[n]‑s[n‑1]进行差分计算得到差分信号y[n];2)计算差分群延迟因子;3)计算差分群延迟因子的希尔伯特包络谱:利用计算差分群延迟因子的希尔伯特包络谱,其中ch(k)为c(k)的希尔伯特变换,ch(k)通过Eh(ω)的离散傅立叶逆变换得到,F(ω)为c(k)的离散傅立叶变换;4)提取差分群延迟因子的希尔伯特包络谱的相关特征;5)浊音和非浊音检测;6)利用差分群延迟因子的希尔伯特包络谱的前三个谱峰幅度的均值特征对浊音进行基音频率估计。
  • 激活音检测及用于激活音检测的方法和装置-201210570563.5
  • 江东平;袁浩;朱长宝 - 中兴通讯股份有限公司
  • 2012-12-25 - 2018-09-04 - G10L25/93
  • 本发明涉及一种激活音检测(VAD)及用于激活音检测的方法和装置,该方法包括:获得当前帧的子带信号及频谱幅值;根据子带信号计算得到当前帧的帧能量参数和谱重心特征参数的值;根据前一帧估计得到的背景噪声能量、当前帧的帧能量参数及信噪比子带能量计算得到当前帧的信噪比参数;根据调性标志、信噪比参数、谱重心特征参数、帧能量参数计算得到VAD判决结果。本发明方法和装置可提高不稳定噪声(如办公室噪声)和音乐检测的准确率。
  • 语音处理方法和语音处理装置-201810184534.2
  • 安黄彬 - 深圳市沃特沃德股份有限公司
  • 2018-03-06 - 2018-08-24 - G10L25/93
  • 本发明揭示了一种语音处理方法和语音处理装置,所述方法包括以下步骤:对声音信号进行语音活动检测,从声音信号中提取出语音信号;对语音信号进行浊音检测,从语音信号中提取出浊音片段;利用浊音片段进行关键词匹配。从而滤除了语音信号中的清音、噪音等干扰项,只利用有效语音(浊音片段)进行匹配运算,一方面大大减少了关键词匹配过程中的计算量,降低了系统功耗,另一方面提高了关键词匹配的准确度。
  • 语音信号处理方法和装置-201410692947.3
  • 肖纯智 - 广州酷狗计算机科技有限公司
  • 2014-11-25 - 2017-12-22 - G10L25/93
  • 本发明公开了一种语音信号处理方法和装置,属于音频处理技术领域。所述方法包括获取麦克风采集的语音信号;检测语音信号是否属于清音信号,清音信号包括正常清音信号和喷麦信号,喷麦信号是指气流从发声者嘴巴喷至麦克风而产生的语音信号;若语音信号属于清音信号,则检测语音信号是否属于喷麦信号;若语音信号属于喷麦信号,则对语音信号进行抑制处理,该抑制处理包括能量衰减处理、删除处理和静默处理中的至少一种。本发明解决了相关技术中针对喷麦的处理方式存在实时性差和效率低的问题;提高了喷麦处理的实时性和效率,且无需人工后期修复,达到了自动检测抑制喷麦的效果。
  • 一种拼音拼读的发音质量评测系统-201510904230.5
  • 王丽;张鹏远;刘建;颜永红 - 中国科学院声学研究所;北京中科信利技术有限公司
  • 2015-12-09 - 2017-06-16 - G10L25/93
  • 本发明提供了一种拼音拼读的发音质量评测系统,所述系统包括前端处理模块、强制对齐模块、发音评测模块、声调评测模块和评测输出模块;所述前端处理模块,用于对输入的拼音拼读语音进行端点检测、声学特征的提取及规整;所述强制对齐模块,用于使用强制对齐技术把所述前端处理模块处理后的语音切分为若干个音素段,获取每个音素的开始时间和截止时间;所述发音评测模块,用于利用发音良好度计算每段音素的后验概率;所述声调评测模块,用于对每段音素的声调进行识别,并判断识别结果与正确声调是否一致,给出声调质量的评估值,所述评测输出模块,用于对音评测模块和声调评测模块输出的评测结果进行综合,得到整体的评测结果,并反馈给用户。
  • 基于各子带特征参数值的清浊音判决装置及其判决方法-201310461580.X
  • 须泽中;郝飞;卢家义 - 上海爱聊信息科技有限公司
  • 2013-09-30 - 2015-04-15 - G10L25/93
  • 本发明公开了一种基于各子带特征参数值的清浊音判决装置,包括语音信号分帧模块、离散高通滤波模块、提取编码的特征参数模块、分割K个频带模块、统计特征参数的特性值模块和清浊音判决模块;本发明还提供了一种基于各子带特征参数值的清浊音判决方法。本发明的判断装置及其判断方法基于当前帧统计特征参数的特性,分析各子带特征参数的相关性来判定各子带的清浊音,能够完全取代IMBE中的判决方进行清浊音判决,能更加精确的获得各个子带的清浊音判定结果,进一步来支持高质量的语音合成;并且,能应用于低码率的移动互联网环境中。
  • 一种清浊音判定方法、装置和语音合成系统-201310179862.0
  • 唐宗尧 - 腾讯科技(深圳)有限公司
  • 2013-05-15 - 2014-11-12 - G10L25/93
  • 本发明实施方式提出了一种清浊音判定方法、装置和语音合成系统。方法包括:设置清浊音判定问题集;利用语音训练数据和清浊音判定问题集,对二叉判定树结构的清浊音判定模型进行训练,其中该二叉判定树结构中的非叶子节点为清浊音判定问题集中的问题,叶子节点为清浊音判定结果;接收语音测试数据,并利用训练后的清浊音判定模型判定语音测试数据为清音或浊音。本发明实施方式提高了清浊音判定成功率以及语音合成质量。
  • 一种抗噪声干扰的浊语音检测方法及系统-201210056627.X
  • 国雁萌;李凯;姜开宇;付强;颜永红 - 中国科学院声学研究所;北京中科信利技术有限公司
  • 2012-03-06 - 2013-09-18 - G10L25/93
  • 本发明公开了一种抗噪声干扰的浊语音检测方法及系统,该方法基于谐波与背景的能量比确定是否存在浊音,并随着干扰噪声的不同,自动的找到频率范围中谐波结构最清晰的频带范围,而忽略受到噪声干扰的频带,所述方法包含:步骤101)针对人类语音的基音频率范围,建立若干基音频率按对数尺度变化的谐波模板;步骤102)基于上步骤的模板,每帧信号与模板的匹配过程均包括若干次能量范围选择,使某受到干扰的频率范围得到忽略;步骤103)利用多帧信号基音频率的连续性,进行浊语音存在性的最终判决。本发明针对人类语音的基音频率范围,利用了基音频率按对数尺度变化的谐波模板,能够只用较少的模板获得良好的匹配结果,从而保证了检测过程的快速准确。
  • 改善音频重现的助听器和方法-201080070566.1
  • J·锡德伯格;H·H·安徒生;M·D·梅恩克;A·B·尼耳森 - 唯听助听器公司
  • 2010-12-08 - 2013-08-14 - G10L25/93
  • 本发明涉及一种包含移频器(20)的助听器,该移频器具有用于检测输入信号中的第一频率和第二频率的装置(22)。移频器(20)基于第一和第二被检测频率之间的固定关系的存在而将输入信号的第一频率范围转移到输入信号的第二频率范围。用于检测第一和第二频率之间的固定关系的装置(34,35,36)被用于控制频率转移器(20)。经配置用于检测浊音语音和清音语音的存在的语音检测器(26)被提供用于抑制浊音语音信号的转移以保留语音共振峰。在助听器中以此方式转移频带的目的是使助听器的用户可以听到不可听见的频率,同时维持信号的原始包络、谐波相干性和语音可理解度。本发明进一步提供用于在助听器中对输入信号的频率范围进行移位的方法。
  • 简易语音性别检测装置-201220299814.6
  • 潘欣裕;诸立骏 - 苏州科技学院
  • 2012-06-26 - 2013-01-02 - G10L25/93
  • 本实用新型公开了一种简易语音性别检测装置,它包括将声音信号转变成电波形的语音采集模块、输入端与所述语音采集模块相连接并用于滤除所述电波形中的高次谐波的低通滤波模块、输入端与所述低通滤波模块的输出端相连接并用于将频率信号转换成电压信号的频率电压转换模块、输入端与所述频率电压转换模块的输出端相连接并用于将模拟信号转换为数字信号的模数转换模块、输入端与所述数模转换模块的输出端相连接并用于判断所述数字信号大小的控制器模块、输入端与所述控制器模块的输出端相连接的显示模块。本实用新型使得基于人语音的性别区分变得简单而快捷,避免了大数据量的训练,且不需要计算机装置。本装置既可以作为复杂身份验证装置的补充,也可以制成一个简易的手持设备,使用方便,具有一定的市场前景。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top