[发明专利]音乐节奏检测方法及其系统有效

申请号：	201710159699.X	申请日：	2017-03-17
公开（公告）号：	CN107103917B	公开（公告）日：	2020-05-05
发明（设计）人：	王子亮;邹应双;武建聪;蔡智力;欧继福;陈待有	申请（专利权）人：	福建星网视易信息系统有限公司
主分类号：	G10L25/81	分类号：	G10L25/81;G10L25/78;G10L25/03
代理公司：	福州市博深专利事务所(普通合伙) 35214	代理人：	林志峥
地址：	350002 福建省福州市仓山区***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种音乐节奏检测方法及其系统，方法包括：获取音乐的音频数据；在所述音频数据中依序获取一音频帧作为当前音频帧，将当前音频帧与上一音频帧的频谱能量和的差值，作为当前音频帧的能量差值并保存所述能量差值；确定当前音频帧对应的能量阈值；获取当前音频帧及其之前的与其相邻的两个以上连续的音频帧的能量差值，得到三个以上的音频帧的能量差值；若所述三个以上的音频帧的能量差值中存在峰值，且所述峰值大于当前音频帧对应的能量阈值，则将所述峰值对应的音频帧标记为节奏点。本发明可准确、快速地检测出音乐中节奏点的位置，且适应性强。
搜索关键词：	音乐节奏检测方法及其系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种音乐节奏检测方法，其特征在于，包括：获取音乐的音频数据；在所述音频数据中依序获取一音频帧作为当前音频帧，将当前音频帧与上一音频帧的频谱能量和的差值，作为当前音频帧的能量差值并保存所述能量差值；确定当前音频帧对应的能量阈值；获取当前音频帧及其之前的与其相邻的两个以上连续的音频帧的能量差值，得到三个以上的音频帧的能量差值；若所述三个以上的音频帧的能量差值中存在峰值，且所述峰值大于当前音频帧对应的能量阈值，则将所述峰值对应的音频帧标记为节奏点。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于福建星网视易信息系统有限公司，未经福建星网视易信息系统有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710159699.X/，转载请声明来源钻瓜专利网。

同类专利

一种歌曲人声检测方法及装置-202210954394.9
发明人：何朋 -专利权人：成都开心音符科技有限公司
申请日： 2022-08-10 - 公布日： 2022-11-11 - 主分类号： G10L25/81
摘要：本申请涉及音频处理技术领域，尤其涉及一种歌曲人声检测方法及装置，其方法包括获取待提取人声的音频数据，并对所述音频数据进行预处理；依据预设的特征提取策略提取预处理后的所述音频数据的音频特征；依据所述音频特征以及预设的人声识别模型，确定所述音频数据中每一音频帧为人声的概率值；当所述概率值达到预设的概率阈值时，则该概率值所对应的音频帧为人声帧；依据所述概率值和所述概率阈值确定所述音频数据中所有的所述人声帧，并确定所有的所述人声帧中时间序列为连续性关系的目标人声帧；依据所有的所述目标人声帧确定所述音频数据中的目标人声音频片段，用户可选择所需的人声音频片段用于后续编辑。

一种音频处理方法、装置、电子设备及存储介质-202111571943.6
发明人：王可尧;张冉;王晓瑞 -专利权人：北京达佳互联信息技术有限公司
申请日： 2021-12-21 - 公布日： 2022-05-17 - 主分类号： G10L25/81
摘要：本公开关于一种音频处理方法、装置、电子设备及存储介质，包括：对音频进行人声检测，得到人声片段，人声片段的时长大于等于第一预设时长，对人声片段进行节拍检测，得到人声片段对应的多个小节，多个小节按照时间戳排序，对多个小节进行聚类，将多个小节分为多个第一聚类片段，多个第一聚类片段中的每个第一聚类片段包括至少一个小节，从多个第一聚类片段中确定第一目标聚类片段，将第一目标聚类片段的起始时间点确定为音频的副歌起始时间点。如此，可以通过设备确定出音频的副歌起始时间点，减少了人力成本和金钱成本。

一种利用神经网络的语音活性检测方法-202110979720.7
发明人：万东琴;胡岸;刘文通;曾帆 -专利权人：成都启英泰伦科技有限公司
申请日： 2021-08-25 - 公布日： 2021-11-09 - 主分类号： G10L25/81
摘要：一种利用神经网络的语音活性检测方法，包括模型训练过程和语音活性检测过程；所述模型训练过程包括以下步骤：S1.对用于训练的纯净语音确定端点检测标签；S2.对纯净语音进行随机加噪，构造训练集；S3.逐帧处理，提取训练集中的多阶多分辨率耳蜗图特征向量；S4.构建多层门控制循环单元网络，利用训练集对其进行训练，得到多层门控制循环单元成熟模型,利用成熟模型进行语音活性检测。本发明利用神经网络良好的分类性能，提取带噪语音的特定特征，并通过预先训练好的神经网络模型，对语音以及噪声进行初步分类并求得一个语音存在概率；通过状态机对获得的语音存在概率进行后处理，从而得到一个平滑且相对准确的语音活性检测标识。

一种单音信号检测方法-202110981601.5
发明人：权友波;王中鑫 -专利权人：苏州安广电子科技有限公司
申请日： 2021-08-25 - 公布日： 2021-10-19 - 主分类号： G10L25/81
摘要：本发明公开了一种单音信号检测方法，包括以下步骤：S1：对当前语音信号进行采集，采用音频编解码芯片wm8960对语音信号进行采集，并对采集的语音信号通过MATLAB转换为数字信号输出；S2：对预处理后的数字信号进行端点检测，采用Verilog HDL（硬件描述语言）对数字信号端点进行检测；S3：对输出的数字信号进行预处理，数字信号特征提取，采用MFCC声学特征提取；S4：对提取的特征进行陷阱滤波检测和ADC信噪比的计算；S5：对检测结果进行处理并输出。本发明通过对语音进行采集和特征进行提取，并将语音的特征输入至陷阱滤波模块中，通过陷阱滤波模块处理后与原始音频数据进行比较，能够快速的识别是否含有单音信号，确保了单音检测的准确性，提高了单音信号检测效率。

人声检测方法、装置及电子设备和计算机可读存储介质-202110138481.2
发明人：张超鹏 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2021-02-01 - 公布日： 2021-06-15 - 主分类号： G10L25/81
摘要：本申请公开了一种人声检测方法、装置及一种电子设备和计算机可读存储介质，该方法包括：获取音频信号，对音频信号进行傅里叶变换，并基于傅里叶变换结果计算音频信号对应的功率谱；根据功率谱构建音频信号对应的沿时间分布的人声可能性概率序列；基于人声可能性概率序列和第一概率阈值在音频信号中确定有效人声片段。本申请提供的人声检测方法，提高了确定有效人声片段的准确性。

一种音频信号分类方法和装置-201610860627.3
发明人：王喆 -专利权人：华为技术有限公司
申请日： 2013-08-06 - 公布日： 2021-04-20 - 主分类号： G10L25/81
摘要：本发明实施例公开了一种音频信号分类方法和装置，用于对输入的音频信号进行分类，该方法包括：根据当前音频帧的声音活动性，确定是否获得当前音频帧的频谱波动并存储于频谱波动存储器中，其中，所述频谱波动表示音频信号的频谱的能量波动；根据音频帧是否为敲击音乐或历史音频帧的活动性，更新频谱波动存储器中存储的频谱波动；根据频谱波动存储器中存储的频谱波动的部分或全部有效数据的统计量，将所述当前音频帧分类为语音帧或者音乐帧。

噪声检测的方法和装置-202011504715.2
发明人：陈洲旋 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2020-12-18 - 公布日： 2021-04-06 - 主分类号： G10L25/81
摘要：本申请提供了一种噪声检测的方法，属于音频处理技术领域。所述方法包括：在目标音频中确定待定噪声音频段，其中，所述待定噪声音频段中的每个音频帧均满足噪声参数条件，且与所述待定噪声音频段相邻的音频帧均不满足所述噪声参数条件；确定与所述待定噪声音频段相邻、且时长与所述待定噪声音频段的时长满足预设条件的至少一个参考音频段；基于所述待定噪声音频段、所述至少一个参考音频段以及噪声判定模型，确定所述待定噪声音频段对应的噪声判定结果，其中，所述噪声判定结果用于指示所述待定噪声音频段是否存在噪声。采用本申请，不需要对目标音频中的所有音频段都进行复杂的模型处理，节省了检测时间，提高了检测效率。

乐器音色迁移下的人声音色相似性度量方法-201810105191.6
发明人：余春艳;齐子铭;刘煌;张栋 -专利权人：福州大学
申请日： 2018-02-02 - 公布日： 2021-03-30 - 主分类号： G10L25/81
摘要：本发明涉及一种乐器音色迁移下的人声音色相似性度量方法。该方法首先计算数据量充分且均衡的乐器数据集音频的对数梅尔频谱特征，得到特征矩阵，用乐器数据训练深度卷积神经网络模型，得到训练好的深度卷积神经网络模型；接着对数据量不充分、不均衡的人声音频数据集，用同样的方法计算得到它的对数梅尔频谱特征，再采用基于迁移学习的微调方法对已训练好的深度卷积神经网络模型进行微调，得到人声音色的表征模型，模型的输出则为人声的音色向量，最后通过计算音色向量之间的余弦相似度，可实现人声音色的相似性度量。

音乐节奏检测方法及其系统-201710159699.X
发明人：王子亮;邹应双;武建聪;蔡智力;欧继福;陈待有 -专利权人：福建星网视易信息系统有限公司
申请日： 2017-03-17 - 公布日： 2020-05-05 - 主分类号： G10L25/81
摘要：本发明公开了一种音乐节奏检测方法及其系统，方法包括：获取音乐的音频数据；在所述音频数据中依序获取一音频帧作为当前音频帧，将当前音频帧与上一音频帧的频谱能量和的差值，作为当前音频帧的能量差值并保存所述能量差值；确定当前音频帧对应的能量阈值；获取当前音频帧及其之前的与其相邻的两个以上连续的音频帧的能量差值，得到三个以上的音频帧的能量差值；若所述三个以上的音频帧的能量差值中存在峰值，且所述峰值大于当前音频帧对应的能量阈值，则将所述峰值对应的音频帧标记为节奏点。本发明可准确、快速地检测出音乐中节奏点的位置，且适应性强。

颤音识别方法及装置-201710186543.0
发明人：孔令城 -专利权人：腾讯音乐娱乐（深圳）有限公司
申请日： 2017-03-25 - 公布日： 2020-04-24 - 主分类号： G10L25/81
摘要：本发明实施例公开了一种颤音识别方法及装置，其中方法包括：获取与包括至少一个标识音符的目标歌曲对应的目标音频数据；提取目标音频数据中与标识音符对应的音频数据片段，提取音频数据片段的第一基频数据，获取对应的第一音符值序列；按照预设的至少一个周期值分别将第一音符值序列划分成至少两个音符值序列分段，针对每一个预设的周期值，计算至少两个音符值序列分段中的两个相邻的音符值序列分段之间的音符距离，作为与该周期值对应的周期音符距离；确定周期音符距离中的最小值，获取最小值对应的目标周期；在目标周期小于预设的周期阈值的情况下，将目标音频数据判定为颤音音频数据。采用本发明，可实现对音频数据中颤音的识别。

用于音频分类和处理的装置和方法-201480018590.9
发明人：芦烈;A·J·希菲尔德;王珺 -专利权人：杜比实验室特许公司
申请日： 2014-03-25 - 公布日： 2019-11-12 - 主分类号： G10L25/81
摘要：公开了用于音频分类和处理的装置和方法。在一个实施例中，音频处理装置包括：音频分类器，用于实时地将音频信号分类为至少一种音频类型；音频改进设备，用于改进听众的体验；以及调整单元，用于基于所述至少一种音频类型的置信度值以连续的方式调整音频改进设备的至少一个参数。

声音信号分析设备以及声音信号分析方法和程序-201410092702.7
发明人：前泽阳 -专利权人：雅马哈株式会社
申请日： 2014-03-13 - 公布日： 2019-05-03 - 主分类号： G10L25/81
摘要：本发明公开了声音信号分析设备以及声音信号分析方法和程序。一种声音信号分析设备（10），其包括：声音信号输入装置，其用于输入表示乐曲的声音信号；拍速检测装置，其用于通过使用所输入的声音信号来检测所述乐曲的每个部分的拍速；判断装置，其用于判断所述拍速的稳定性；以及控制装置，其用于根据由所述判断装置判断的结果来控制特定目标。

用于音频分类和处理的装置和方法-201910010064.2
发明人：芦烈;A·J·希菲尔德;王珺 -专利权人：杜比实验室特许公司
申请日： 2014-03-25 - 公布日： 2019-04-12 - 主分类号： G10L25/81
摘要：本公开涉及用于音频分类和处理的装置和方法。在一个实施例中，音频处理装置包括：音频分类器，用于实时地将音频信号分类为至少一种音频类型；音频改进设备，用于改进听众的体验；以及调整单元，用于基于所述至少一种音频类型的置信度值以连续的方式调整音频改进设备的至少一个参数。

单通道音乐人声分离中的多种特定乐器强化分离方法-201510409132.4
发明人：余春艳;林明安;滕保强;张栋;刘灵辉 -专利权人：福州大学
申请日： 2015-07-14 - 公布日： 2018-11-27 - 主分类号： G10L25/81
摘要：本发明涉及一种单通道音乐人声分离中的多种特定乐器强化分离方法。该方法对电吉他、单簧管、小提琴、钢琴、木吉他、风琴、长笛和小号共计8种乐器进行强化分离，该强化分离是通过一层单乐器分离器和三层多乐器组合强化器实现，其中，第一层多乐器组合强化器能够分离2类乐器声，第二层多乐器组合强化器能够分离4类乐器声，第三层多乐器组合强化器能够分离8类乐器声。本发明利用DRNN作为单乐器分离器的核心，为不同的单乐器分离器建立不同的DRNN模型；同时，采用BP网络作为多乐器分离器的核心来实现多乐器的分离；最后，提出了针对该系统不同的单乐器分离器的训练样本的构建方法，本发明方法简单灵活，具有较强的实用性。

一种用于广播监播的辨音系统及方法-201710554380.7
发明人：胡耀文;孙俊;王桂碌;邵玉斌;龙华 -专利权人：昆明理工大学
申请日： 2017-07-10 - 公布日： 2017-12-01 - 主分类号： G10L25/81
摘要：本发明公开了一种用于广播监播的辨音系统及方法，包括信号处理模块，用于处理目标广播信号，得到目标广播信号中的音频信号；门限比较模块，用于滤除音频中幅值低于门限值的信号，完成模拟信号到数字信号的转换；中央处理器，用于控制门限比较模块的门限值，测算输入信号的频率，根据门限值和信号频率判别出目标音频信号中是语音或是音乐，并且中央处理器能够实时采集数据信息；数据存储模块，用于存储中央处理器采集的数据信息；结果输出模块，用于输出显示相应的结果。本发明辨音系统的实现几乎只用硬件即可实现，造价低且可行性高，占用软件资源极少。

音乐调酒方法和系统-201610971643.X
发明人：丁西龙 -专利权人：丁西龙
申请日： 2016-11-07 - 公布日： 2017-03-22 - 主分类号： G10L25/81
摘要：本发明提供了一种音乐调酒方法和系统，涉及计算机领域和调酒技术领域，该方法包括获取歌曲中乐器的数据信息；根据乐器的数据信息统计各类乐器的小节数在歌曲中乐器的小节总数中所占的比例，从而得到各类乐器的比例信息；将各类乐器根据音乐属性进行判别，并为判别后的各类乐器设定相应的标识信息；根据音乐属性设置相应基酒的度数和为各类乐器分配相应的辅料；将所述基酒和所述辅料根据各类乐器的比例信息生成调酒配方。本发明将音乐和调酒相结合，通过音乐生成调酒配方，以调酒的方式从味觉上获取听音乐带给客户的感觉，满足客户需求，提高客户体验，为调酒师提供一个新的调酒方法。

一种用于歌曲评分的曲谱生成方法和设备-201510784342.1
发明人：张瑞怀;董昌朝;刘小峰;陈伟煌 -专利权人：福建省百利亨信息科技有限公司
申请日： 2015-11-16 - 公布日： 2016-05-18 - 主分类号： G10L25/81
摘要：一种用于歌曲评分的曲谱生成方法和设备，其涉及一种音频数据中的信息提取，特别涉及从歌曲中提取曲谱生的方法。包括下述步骤：S010、获取原唱音轨中的一段实信号X0和伴奏音轨中与实信号X0对应的一段实信号X1；S020、对上述实信号X0和X1实施加窗离散傅里叶变换，得到对应原唱音轨的能量分布谱X0’和对应伴奏音轨的能量分布谱X1’；S030、根据能量分布谱X0’和能量分布谱X1’计算原唱音轨与伴奏音轨在各频段上能量的差值，根据差值获得人声能量分布谱Xmag_diff。本方法提供一种批量生成乐谱的方法。

音频识别及纠正系统-201310350184.X
发明人：杨登峰;杨采灵;向琼芳 -专利权人：上海玄武信息科技有限公司
申请日： 2013-08-13 - 公布日： 2013-11-27 - 主分类号： G10L25/81
摘要：本发明公开了一种音频识别及纠正系统，用于识别演奏者的演奏是否正确，包括：一第一工作单元，用于采集演奏者演奏时的声音信号，并将该声音信号中的每个音频处理得到相对应的频率；一第二工作单元，保存有演奏曲目的midi文件，并将该演奏曲目中的每个音符解析得到对应的标准频率；一分析模块，用于比对第一工作单元与第二工作单元所得到的两组音频的频率是否相同。比对时，标准频率的数值大小反映了该频率对应的是哪个音符，标准频率的时间长短反映了该音符应该演奏多少节拍。演奏者通过本发明的音频识别及纠正系统，就可以及时知道哪个时间段应该演奏哪个音符，以及应该演奏多少节拍，以及实际演奏有没有出错，哪里出错了。下次演奏就可以有针对性的改进，从而大大提高了学习效率。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]音乐节奏检测方法及其系统有效

专利文献下载