[发明专利]一种亚音频尾音检测的方法与装置有效

申请号：	201110458287.9	申请日：	2011-12-29
公开（公告）号：	CN103187069A	公开（公告）日：	2013-07-03
发明（设计）人：	张凌雁;胡赛桂;宋鹏涛;张业龙;何海波;王荣	申请（专利权）人：	福建联拓科技有限公司;北京联拓恒芯科技发展有限公司
主分类号：	G10L25/87	分类号：	G10L25/87;G10L21/0208
代理公司：	北京同达信恒知识产权代理有限公司 11291	代理人：	黄志华
地址：	362000 福建***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种亚音频尾音检测方法与装置，该方法包括：对接收信号进行滤波，并根据设定的离散傅里叶变换DFT窗长，计算滤波后的信号在目标频率上的DFT值；根据当前计算的DFT值，及之前计算的DFT值，获得DFT叠加值；计算当前获得的DFT叠加值的功率归一化值；通过比较不同次得到的DFT叠加值的功率归一化值，确定是否检测到尾音。本发明充分利用了随着亚音频信号相位的反转，对亚音频信号进行离散傅里叶变换得到的DFT值发生变化的特性来确定是否检测到尾音，具有计算量小、计算复杂度低等优点。
搜索关键词：	一种音频尾音检测方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种亚音频尾音检测方法，其特征在于，包括：对接收信号进行滤波，并根据设定的离散傅里叶变换DFT窗长，计算滤波后的信号在目标频率上的DFT值；根据当前计算的DFT值，及之前计算的DFT值，获得DFT叠加值；计算当前获得的DFT叠加值的功率归一化值；通过比较不同次得到的DFT叠加值的功率归一化值，确定是否检测到尾音。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于福建联拓科技有限公司;北京联拓恒芯科技发展有限公司，未经福建联拓科技有限公司;北京联拓恒芯科技发展有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201110458287.9/，转载请声明来源钻瓜专利网。

上一篇：一种超高环刚度塑钢复合管及其制备方法
下一篇：一种发动机点火提前角的调整方法

同类专利

一种音频信号中断检测方法-201610630966.2
发明人：张洪英;张杰良;成立然;刘刚 -专利权人：成都普创通信技术股份有限公司
申请日： 2016-08-02 - 公布日： 2019-10-11 - 主分类号： G10L25/87
摘要：本发明公开了一种音频信号中断检测方法，通过对音频信号进行分帧，并对待测帧电平峰峰值和频谱最大值进行计算，将计算结果与预设的阈值相比较，能够实现在音频信号传输过程中准确检测是否存在中断，减少误判，客服传统的检测方法准确率低、容易发生误判、响应速度慢的问题。

一种对话冲突检测方法及装置-201610983739.8
发明人：谢湘;肖艳红;徐利强 -专利权人：北京理工大学
申请日： 2016-11-08 - 公布日： 2019-09-27 - 主分类号： G10L25/87
摘要：本发明公开了一种对话冲突检测方法及装置，应用于电子设备，该方法包括：针对待检测语音信号，将待检测语音信号划分为多个语音信号片段；针对每个语音信号片段，确定该第一语音信号片段的基因频率的均值、方差及极差，MFCC及一阶二阶差分特征参数的均值和方差，并识别该第一语音信号片段的无声段持续时间；并根据对话冲突检测模型确定当前待检测语音信号片段的冲突等级；根据冲突等级判断该语音信号片段是否为对话冲突语音片段。由于在本发明实施例中，在进行对话冲突检测时，只需对语音信号片段基因频率的均值、方差及极差等少量的参数进行运算，极大的减少了对话冲突检测时的计算量，提高了对话冲突检测的效率及反应速度。

基于变分模态分解和感知哈希的语音端点检测方法-201811526264.5
发明人：李晔;张鹏;张杰;宫晓飞 -专利权人：山东省计算中心(国家超级计算济南中心)
申请日： 2018-12-13 - 公布日： 2019-09-10 - 主分类号： G10L25/87
摘要：本发明公开了一种基于变分模态分解和感知哈希的语音端点检测方法，该方法包括：接收输入语音信号；将输入语音信号进行VMD分解，将VMD分解后的固有模态函数分别进行短时时频分析，得到时频分析矩阵，根据感知哈希算法计算时频分析矩阵的感知哈希值；将输入语音信号VMD分解后时频分析矩阵的感知哈希值与环境噪声VMD分解后时频分析矩阵的感知哈希值进行比较，判断输入语音信号的语音段和噪声段。

一种采用非线性特征的语音端点检测方法-201610204170.0
发明人：王丹丹;臧娴 -专利权人：金陵科技学院
申请日： 2016-04-01 - 公布日： 2019-08-27 - 主分类号： G10L25/87
摘要：本发明公开了一种采用非线性特征的语音端点检测方法，包括对音频信号进行预加重处理；对经过预加重处理的音频信号进行分帧处理；对每一帧音频信号进行幅值分割，计算此帧音频信号的李亚普诺夫指数；将每一帧音频信号的李亚普诺夫指数与设定的阈值做比较，判别出音频信号的端点。本发明更加针对语音的本质，在降低运算复杂度的同时，也提供了更准确的信息去完善语音端点检测系统的性能。正确有效地检测出语音段不仅可以减少计算量和缩短处理时间，而且能排除非有效语音段的噪声干扰，从而使后续语音处理工作及整个系统的识别性能得到较大的提高。

一种无前导静音段语音的端点检测方法-201610149314.7
发明人：董明;张超 -专利权人：大连理工大学
申请日： 2016-03-16 - 公布日： 2019-07-30 - 主分类号： G10L25/87
摘要：本发明属于语音信号处理技术领域，一种无前导静音段语音的端点检测方法，包括以下步骤：步骤1、采用LMS自适应算法对带噪语音滤波，步骤2、将去噪后的语音从时域变换到频域，步骤3、计算每一帧的MFCC参数，步骤4、分别计算每一帧的谱熵，步骤5、采用FCM对语音信号进行分类，步骤6、计算步骤5中每类的平均谱熵，并标记出语音信号和噪声信号。本发明方法无需设置阈值，因此不会出现因设置阈值错误而造成端点检测错误；与神经网络等有监督的聚类方法相比，本方法无需训练样本，计算简单，快速，有利于后续的实时语音识别系统的设计。

语音端点检测方法和装置-201410779544.2
发明人：刘粉香 -专利权人：北京国双科技有限公司
申请日： 2014-12-15 - 公布日： 2018-09-18 - 主分类号： G10L25/87
摘要：本发明公开了一种语音端点检测方法和装置。其中，语音端点检测方法包括：获取目标环境下的待测音频；利用预先生成的语音训练模型对待测音频中的音频片段进行标记，将待测音频中的语音片段标记为第一预设标识，其中，语音训练模型为对目标环境的语音数据进行训练得到的模型；以及从标记的待测音频中查找具有第一预设标识的整段音频，其中，整段音频为一整段标记有第一预设标识的语音；将具有第一预设标识的整段音频的作为一段语音，具有第一预设标识的整段音频的起始点和结束点作为一段语音的端点。通过本发明，解决了现有技术中在噪音大的情况下语音端点检测的准确性较低的问题，达到了提高语音端点检测的准确性。

一种语音上传方法及装置-201711092928.7
发明人：郭建辉 -专利权人：天脉聚源（北京）传媒科技有限公司
申请日： 2017-11-08 - 公布日： 2018-03-30 - 主分类号： G10L25/87
摘要：本发明公开了一种语音上传方法及装置。所述方法包括接收输入的语音；在接收语音的过程中，判断是否接收到语音结束事件；当接收到所述语音结束事件时，上传当前段的语音。通过本发明的技术方案，在接收语音的过程中，判断是否接收到语音结束事件，当接收到所述语音结束事件时，才上传当前段的语音，从而确保每次上传的语音是一个完整的语句，从而有利于之后进行语音识别。

一种基于位置信息的语音端点检测方法-201710624269.0
发明人：魏浩然;龙艳花;冯志民;叶宏;茅红伟 -专利权人：上海师范大学
申请日： 2017-07-27 - 公布日： 2018-01-09 - 主分类号： G10L25/87
摘要：本发明涉及一种基于位置信息的语音端点检测方法，所述方法包括下列步骤采集音频，同时获取音频对应的位置信息；根据音频对应的位置信息，确定音频所处的噪声环境，并选取相应的深度神经网络端点检测模型；将音频作为输入通过选定的深度神经网络端点检测模型进行端点检测，得到的输出结果作为语音端点的检测结果。与现有技术相比，本发明具有检测结果准确、易于实现以及实用性能强优点。

一种非合作语音通信接收数据无用时间段识别方法-201710588115.0
发明人：詹毅 -专利权人：嘉兴开泽电子设备有限公司
申请日： 2017-07-17 - 公布日： 2017-12-22 - 主分类号： G10L25/87
摘要：本发明涉及到一种对接收到的无线电语音通信信号和信息的处理方法，属于通信和信息技术领域。特别是涉及一种对无线电语音通信经过解调后进行语音数据检测、分段和识别，识别出噪声和干扰等无用信号时间段的一种方法。本项发明基于统计数学、统计聚类分析和模糊信号处理的原理，提出一种针对非合作无线电语音通信接收解调后非语音段识别统一架构集成处理方法，提出一种发现突发瞬态干扰的检测方法，提出一种发现来自其它电台突发同频串音干扰的检测方法，提出一种不依赖于信号功率强度和过零率的语音信号和噪声信号段检测和识别方法，提出一种发现并识别电台故障数据的方法，最后，通过集成识别模拟语音数据和其它数字调制数据的方法。

基于基频的端点检测系统及其计算方法-201410221983.1
发明人：赵茂祥;贾昌辉;李全忠;蒲瑶;何国涛 -专利权人：普强信息技术（北京）有限公司
申请日： 2014-05-23 - 公布日： 2017-06-09 - 主分类号： G10L25/87
摘要：本发明涉及一种基于基频的端点检测系统及其计算方法，通过基频提取算法得到基频出现的所有可能位置然后由代价确定基频，但由于基频可能被低频噪声所干扰，所以利用基频出现的位置应该有谐波结构的特点来辅助判断该点是否为语音。同时，根据背景能量的自适应以加快端点检测的速度及提高检测的准确度。本发明的基于基频的端点检测系统及其计算方法在信噪比不好的情况下，能够使端点检测系统具有较高的鲁棒性。在时域难于区分噪声的情况下，此方法利用噪声信号和语音信号在频谱分布有区别于时域分布的明显不同特征，可以使噪声在频域能够正确的被区分。此方法可以广泛的应用于语音信号处理领域。

基于动态时间归整算法的离线语音端点检测的方法和装置-201410337409.2
发明人：冯宇红 -专利权人：无锡中感微电子股份有限公司
申请日： 2014-07-15 - 公布日： 2017-06-06 - 主分类号： G10L25/87
摘要：本发明公开了一种基于动态时间归整算法的离线语音端点检测的方法和装置，包括提取语音数据的特征参数和语音能量值，并获取具有最大的语音能量值的语音数据帧；依次选择参考模板，根据所选参考模板的长度和语音数据帧，确定语音数据中孤立词语音的搜索范围及搜索窗长度的范围，进而对每个搜索起点按照多个搜索窗长度分别进行搜索，从而获取多个相应的测试模板；利用DTW算法，计算每一测试模板与所选参考模板的匹配距离得分；识别其中匹配距离得分最小的测试模板的搜索窗的起点和终点为孤立词语音端点。

一种低信噪比环境下基于谱熵改进的语音端点检测方法-201710086400.2
发明人：张毅;王可佳;颜博 -专利权人：重庆邮电大学
申请日： 2017-02-17 - 公布日： 2017-05-10 - 主分类号： G10L25/87
摘要：本发明请求保护一种低信噪比环境下基于谱熵改进的语音端点检测方法，针对当前说话人识别中由于低信噪比环境下造成语音端点检测系统准确率不高的问题，提出了一种低信噪比环境下提高语音端点检测准确率的端点检测方法(1)根据语音信号的特点对其进行信号的预处理；(2)根据语音信号每帧频带的划分，计算各子带谱熵和子带能量，最终得到各子带能熵比SEH；(3)设置合适门限值，然后结合中值滤波得到语音的起止位置；目的是通过中值滤波去除环境噪声的影响，以使语音信号更加平稳，提高低信噪比环境下端点检测的准确率。

语音端点的检测方法和装置-201410042094.9
发明人：吴丽丽 -专利权人：华为技术有限公司
申请日： 2014-01-28 - 公布日： 2017-01-25 - 主分类号： G10L25/87
摘要：本发明提供了一种语音端点的检测方法和装置，所述方法包括对待检测信号进行分帧处理得到信号帧序列；对于每个信号帧，获取其低频能量、中频能量以及全频能量后计算起始点判断特征值；根据所有信号帧的起始点判断特征值设定起始点判决门限后确定语音起始帧；根据语音起始帧之前的噪音帧建立噪音模型，计算语音起始帧之后的每个信号帧与语音起始帧之前的噪音帧的差异度；对于每个语音起始帧之后的信号帧，根据其低频能量、中频能量以及计算获取的差异度，计算终止点判断特征值；根据语音起始帧之后信号帧的终止点判断特征值设定终止点判决门限后确定语音终止帧。使用本发明能提高语音端点检测的准确率。

一种基于似然比测试的噪声鲁棒性的检测方法-201610008285.2
发明人：李为;朱杰;包旭雷 -专利权人：深圳市音加密科技有限公司
申请日： 2016-01-07 - 公布日： 2016-05-11 - 主分类号： G10L25/87
摘要：本发明公开了一种基于似然比测试的噪声鲁棒性的检测方法，分别从信噪比的估计、阈值的鲁棒性设置和拖尾失真消除三个方面进行改进，使得提出的算法相对于现有技术在低信噪比环境下尤其是非平稳噪声环境下具有更好的检测性能。本发明所述的方法与基于谐波特征的多观测似然比测试算法具有相似的语音边界检测正确率，但却比基于谐波特征的多观测似然比测试算法具有更好的声音检测精度，从而验证本方法要比传统的方法在性能上更为优异；同时，本方法在15dB和25dB的信噪比下具有相似的性能，说明它对噪声具有很好的鲁棒性；本发明在实际环境中可以作为语音识别或者声纹识别系统的前端预处理重要的有效方法，拥有很好的应用价值。

一种基于DSP的语音端点检测系统-201320097898.X
发明人：张梅 -专利权人：安徽理工大学
申请日： 2013-03-04 - 公布日： 2013-11-13 - 主分类号： G10L25/87
摘要：本实用新型公开了一种基于DSP的语音端点检测系统，包括有核心处理单元TMS320VC5416DSP、语音信号编解码模块TLV320AIC23芯片、PC机、电源电路、复位电路、时钟电路；，TLV320AIC23芯片信号输出端接入TMS320VC5416DSP信号输入端，TMS320VC5416DSP通过一个异步串口收发器TL16C550和一个电平转换芯片MAX232与PC机相连；系统通过TLV320AIC23芯片输入采集的语音信号，将其转化为数字信号后送入TMS320VC5416DSP进行基于模糊神经网络的语音端点检测算法运算，接着TMS320VC5416DSP处理好的数据通过异步串口收发器TL16C550和电平转换芯片MAX232与PC机进行串行通信，系统还外扩了一片SRAM存储器和一片FLASH存储器。本实用新型采用了TMS320VC5416DSP为核心芯片，并采用模糊神经网络来实现语音端点检测算法，具有适应性好，实时性高，鲁棒性强等优点。

一种亚音频尾音检测的方法与装置-201110458287.9
发明人：张凌雁;胡赛桂;宋鹏涛;张业龙;何海波;王荣 -专利权人：福建联拓科技有限公司;北京联拓恒芯科技发展有限公司
申请日： 2011-12-29 - 公布日： 2013-07-03 - 主分类号： G10L25/87
摘要：本发明公开了一种亚音频尾音检测方法与装置，该方法包括：对接收信号进行滤波，并根据设定的离散傅里叶变换DFT窗长，计算滤波后的信号在目标频率上的DFT值；根据当前计算的DFT值，及之前计算的DFT值，获得DFT叠加值；计算当前获得的DFT叠加值的功率归一化值；通过比较不同次得到的DFT叠加值的功率归一化值，确定是否检测到尾音。本发明充分利用了随着亚音频信号相位的反转，对亚音频信号进行离散傅里叶变换得到的DFT值发生变化的特性来确定是否检测到尾音，具有计算量小、计算复杂度低等优点。

基于时频瞬时能量谱的低信噪比语音端点检测方法-201310017877.7
发明人：范影乐;陈金龙;倪红霞;廖进文;李丹菁 -专利权人：杭州电子科技大学
申请日： 2013-01-17 - 公布日： 2013-05-22 - 主分类号： G10L25/87
摘要：本发明涉及一种基于时频瞬时能量谱的低信噪比语音端点检测方法。传统方法降噪效果不是很理想。本发明方法将时频瞬时能量谱特征作为端点检测的依据，首先对含噪语音进行小波包分解，并对分解后的低频分量进行重构。利用经验模态分解对重构后的信号进行处理，并运用相关系数阈值准则进行固有模态函数的筛选和剔除，获取有效IMF分量。重组得到的IMF分量，进行Hilbert变换并计算相应的瞬时能量谱，构成语音端点检测的特征向量。对得到的结果进行分帧处理，将前5帧瞬时能量谱均值作为噪声的瞬时能量谱，并采用语音起-止双阈值门限法进行含噪语音的端点检测。本发明使含噪语音的时频分辨能力得到显著的改善，提高了语音端点检测的效率。

一种低信噪比下语音端点检测方法-201310019031.7
发明人：王健;韩志艳 -专利权人：渤海大学
申请日： 2013-01-19 - 公布日： 2013-05-22 - 主分类号： G10L25/87
摘要：本发明涉及一种低信噪比下语音端点检测方法，其包括：语音信号预处理、短时能零积计算、子带能量鉴别信息计算、噪声更新因子计算及帧判决。综合短时能量积和鉴别信息的互补优势，首先利用短时能零积进行判决，当遇到噪声帧与语音帧的转折帧时，再利用基于子带能量鉴别信息的方法进行复检，因此避免了因噪声幅度急剧变化和结尾语音帧被噪声淹没而导致的误检。与现有方法相比，即使在信噪比变化剧烈的情况下仍能准确快速地检测出语音的起止点，对语音信号的后续研究起了很好的铺垫作用。

一种基于实时解码的语音端点检测方法-201210483046.4
发明人：吴玲;王兵;赵乾;潘颂声;何春江;朱群 -专利权人：安徽科大讯飞信息科技股份有限公司
申请日： 2012-11-24 - 公布日： 2013-03-20 - 主分类号： G10L25/87
摘要：一种基于实时解码的语音端点检测方法，步骤为：输入语音识别相关文本，解析文本；根据文本解析结果构建解码网络；输入语音，提取语音中的声学特征，基于构建的解码网络对所述声学特征进行解码，得到解码后的语音单元序列；对解码后的语音单元序列进行语音端点判断，判断是否是语音端点，所述语音端点分为语音开始点和语音结束点；如果判断结果是语音结束点，则把语音结束点信息反馈给外部外部应用系统，否则继续第二步；在第三步中语音开始点判断是可选的，如果外部外部应用系统不关心语音开始点，则不判断语音开始点。本发明解决了在语音识别文本确定的情况下，传统端点检测技术表现出来的实时性不高，无法对用户关心的语音进行针对性检测问题。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种亚音频尾音检测的方法与装置有效

专利文献下载