[发明专利]一种基于音符和时值建模的哼唱识谱方法及系统有效

申请号：	201410066451.5	申请日：	2014-02-26
公开（公告）号：	CN103824565B	公开（公告）日：	2017-02-15
发明（设计）人：	曾新;徐明;王利斌	申请（专利权）人：	曾新;徐明;王利斌
主分类号：	G10L21/06	分类号：	G10L21/06
代理公司：	深圳市恒申知识产权事务所(普通合伙)44312	代理人：	陈健
地址：	410083 湖南省长沙***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明适用于计算机应用技术领域，提供了一种基于音符和时值建模的哼唱识谱方法，本发明建立有包括音符音高模型集和音符时值模型集在内的乐理高斯混合模型库，所述乐理高斯混合模型库中的所有模型均事先通过乐理高斯混合模型训练单元进行模型参数训练，并可选用乐理高斯混合模型重估训练单元进行模型参数的重估训练，哼唱识谱时，对采集的用户哼唱语音分别进行音高特征提取、乐理信息解码识别、节拍提取、乐理处理与变换，最后输出成标准乐谱。本发明方法设计的哼唱识谱系统识别率高、稳定性好，还能适应个人的唱歌行为特点，可作为专业人员或音乐爱好者的创作助手和备用工具，具有推广应用价值和产业化前景。
搜索关键词：	一种基于音符时值建模哼唱方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于音符和时值建模的哼唱识谱方法，其特征在于，所述方法包括下述步骤：步骤A，于用户的哼唱语音中，提取当前语音帧的音高；步骤B，根据预先建立的音符音高模型集，利用步骤A提取的音高分别计算出当前语音帧属于所述音符音高模型集中各个音符音高模型的概率值，根据计算的概率值以及音符音高模型集对当前语音帧进行音符音高模型匹配识别，若当前语音帧与其前一相邻语音帧分属不同的音符音高模型时，记录下当前语音帧号；步骤C，重复步骤A到步骤B，当哼唱语音依序逐语音帧全部处理完毕后，确定出哼唱语音所对应的音符音高模型序列以及序列中各个音符音高模型的起始语音帧号，计算出所述各个音符音高模型各自所持续的语音帧数，并累积分析语音帧的音高变化情况，判断出其中包含的旋律段后提取该旋律段的节拍信息；步骤D，根据预先建立的音符时值模型集，从步骤C确定的音符音高模型序列中依次选取出一个音符音高模型，利用其所持续的语音帧数分别计算出选取的音符音高模型属于所述音符时值模型集中各个音符时值模型的概率值，根据计算的概率值以及音符时值模型集对选取的音符音高模型进行音符时值模型匹配识别；步骤E，重复步骤D，当步骤C中确定的全部音符音高模型序列处理完毕后，得出哼唱语音所包含的各个音符音高模型序列以及各个音符音高模型持续语音帧数所对应的音符时值模型，形成一组<音符音高模型，音符时值模型>序列；步骤F，根据步骤A提取的音高和步骤C提取的节拍信息，对步骤E确定的哼唱语音的<音符音高模型，音符时值模型>序列进行乐理转换处理，得到对应的<标准音符，标准时值>序列，据此生成对应的乐谱。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于曾新;徐明;王利斌，未经曾新;徐明;王利斌许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201410066451.5/，转载请声明来源钻瓜专利网。

同类专利

语音转化手写笔迹的方法和装置-201610571390.7
发明人：李纯冬 -专利权人：广州视睿电子科技有限公司;广州视源电子科技股份有限公司
申请日： 2016-07-18 - 公布日： 2019-07-09 - 主分类号： G10L21/06
摘要：本发明涉及一种语音转化手写笔迹的方法和装置，语音转化手写笔迹的方法，包括以下步骤：在接收到用户输入的语音数据时，对语音数据进行语音识别处理，得到语音数据对应的语音内码；在笔迹数据库中对语音内码进行检索，在检索到与语音内码对应的笔迹内码时，从笔迹数据库中获取笔迹内码对应的手写笔迹的关键数据；关键数据包括手写笔迹的以下数据中的任意一种或任意组合：轨迹数据、截图数据和矢量图形数据；对关键数据进行笔迹还原处理，得到手写还原笔迹。本发明使得用户在可书写设备上进行书写时，可以通过语音输入，将语音数据转化成书写笔迹进行补充，过程简单，使用方便。

警示音离线识别方法及装置-201810422085.0
发明人：张立新 -专利权人：深圳市沃特沃德股份有限公司
申请日： 2018-05-04 - 公布日： 2018-11-16 - 主分类号： G10L21/06
摘要：本发明提出的警示音离线识别方法及装置，其中方法包括：获取当前声音的数字信号；将所述数字信号与预存的警示音语音库进行匹配，得到匹配的警示音；根据所述警示音语音库预先匹配的震动类型表，调用与所述警示音相对应的震动类型；根据所述震动类型产生相对应的第一震动。本发明提供一种适用于听力障碍者的警示音离线识别方法及装置。

利用波形的声音到触觉效应转换系统-201210131186.5
发明人： R·巴提亚;K·甘地;C·J·奥瑞奇;J·M·克鲁兹-埃尔南德斯;H·T·提蒙;J·H·F·劳 -专利权人：意美森公司
申请日： 2012-02-10 - 公布日： 2018-03-06 - 主分类号： G10L21/06
摘要：本公开涉及利用波形的声音到触觉效应转换系统。提供了一种触觉转换系统，其截取音频数据的帧，例如数字音频信号，将帧转换为触觉信号，并通过致动器播放该生成的触觉信号来产生触觉效应。该触觉信号基于每个音频数据帧的最大值，其定义该触觉信号的振幅。该触觉信号被应用到配置为接收该触觉信号的致动器，该致动器利用该触觉信号来产生一个或多个触觉效应。

一种基于音符和时值建模的哼唱识谱方法及系统-201410066451.5
发明人：曾新;徐明;王利斌 -专利权人：曾新;徐明;王利斌
申请日： 2014-02-26 - 公布日： 2017-02-15 - 主分类号： G10L21/06
摘要：本发明适用于计算机应用技术领域，提供了一种基于音符和时值建模的哼唱识谱方法，本发明建立有包括音符音高模型集和音符时值模型集在内的乐理高斯混合模型库，所述乐理高斯混合模型库中的所有模型均事先通过乐理高斯混合模型训练单元进行模型参数训练，并可选用乐理高斯混合模型重估训练单元进行模型参数的重估训练，哼唱识谱时，对采集的用户哼唱语音分别进行音高特征提取、乐理信息解码识别、节拍提取、乐理处理与变换，最后输出成标准乐谱。本发明方法设计的哼唱识谱系统识别率高、稳定性好，还能适应个人的唱歌行为特点，可作为专业人员或音乐爱好者的创作助手和备用工具，具有推广应用价值和产业化前景。

创新工作室应用系统-201620435230.5
发明人：徐尧 -专利权人：中国共产党普洱市纪律检查委员会
申请日： 2016-05-13 - 公布日： 2016-11-16 - 主分类号： G10L21/06
摘要：本实用新型公开一种创新工作室应用系统，属会议室应用系统技术领域，其特征在于，应用系统由设备区域和讨论区域构成，所述设备区域包括录音录像设备、存储设备和处理设备，录音录像设备中的数个麦克风预先放置于在讨论区域内，录音录像设备通过无线或有线对讨论区域进行声音或视频实时传输到存储设备中存储，处理设备将存储设备内的音频内容实时转换成文字信号，将并文字信号实时显示在屏幕或者显示器上。讨论结束后，处理设备将存储设备的音频内容转换成文本内容记录下来。本实用新型提供的创新工作室的应用系统现代化、智能化，保证讨论者在工作室内全心参与讨论，更大地发挥思考空间，改善讨论效果，提高集体的创新能力。

一种语音处理方法及装置-201410838240.9
发明人：王朝民;冯俊兰 -专利权人：中国移动通信集团公司
申请日： 2014-12-29 - 公布日： 2016-07-27 - 主分类号： G10L21/06
摘要：本发明提供了一种语音处理方法及装置。所述语音处理方法，包括：对热线语音数据进行处理，获取所述热线语音数据的文本信息以及热线语音数据中涉及的用户语音信息；根据所述文本信息以及用户语音信息，获取所述热线语音数据的评价结果。上述方案，结合语音数据中的文本信息以及语音信息对客服服务的用户满意度进行评价，能够更加全面更加细致的评价客服录音的用户满意度情况，扩大了满意度评价的对象规模，同时节省了人力成本，更好的为客服热线运营提供技术支撑。

基于声纹识别的智能程序控制方法-201510536149.6
发明人：宋科璞;王东辉;田一松;李国玉;刘宏明;夏立群;解庄;花韬;贺琛;杨远超;王熙;行登海 -专利权人：中国航空工业集团公司西安飞行自动控制研究所;厦门厦工机械股份有限公司
申请日： 2015-08-27 - 公布日： 2016-03-09 - 主分类号： G10L21/06
摘要：本发明提供了一种基于声纹识别的智能程序控制方法，对采集到的音频信号进行波形识别、声音信号幅值和频率特征提取，转换为方波信号；在方波信号的每个上升沿计数一次，依次将方波信号分配到动臂、铲斗、转向三个控制通道；将三个控制通道所控制对象的运动状态反馈与控制对象的运动范围限制进行比较，当控制对象的运动状态反馈超过运动范围限制时反转正弦信号的极性，从而让控制对象的运动反向。本发明对采集到的声纹信号进行处理，并应用其生成程序控制装载机的动臂、铲斗和转向进行复合操作，实现了对装载机的智能程序控制。

一种正常人与聋、哑、盲人群的对话装置及其使用方法-201510258510.3
发明人：张开生;韦逸野;王静 -专利权人：陕西科技大学
申请日： 2015-05-20 - 公布日： 2015-08-12 - 主分类号： G10L21/06
摘要：一种正常人与聋、哑、盲人群的对话装置，包括有微处理器，微处理器内设有语音处理器和语音转换器，语音处理器通过语音识别装置与音频放大器相连；语音处理器的输出端通过盲文转换器A与阵列驱动器相连；语音转换器的输出端与语音播放器相连；语音转换器的输入端通过盲文转换器B与盲文书写装置相连；通过微处理器将正常人的语音信息转换成汉字信息，并结合汉字再转化成盲文信息，将盲文信息通过相应的阵列驱动器转换成对应盲文凸凹阵列，供聋、哑、盲人群触摸感知；聋、哑、盲人与常人对话时，在对话装置上书写盲文，将盲文转换成对应语音播放给正常人；解决了聋、哑、盲人群不能与正常人进行语言交流问题。

交互式语音应答业务中的语音识别方法及装置-201310698758.2
发明人：李志明 -专利权人：中兴通讯股份有限公司
申请日： 2013-12-18 - 公布日： 2015-06-24 - 主分类号： G10L21/06
摘要：本发明提供了一种交互式语音应答业务中的语音识别方法及装置，其中，该方法包括：获取终端用户的语音信息；将所述语音信息转换为第一文件信息；根据所述第一文件信息按照预设规则获取第二文件信息，将所述第二文件信息作为所述语音信息的识别结果。采用本发明提供的上述技术方案，解决了相关技术中，尚无有效的技术方案实现交互式语音应答IVR业务的问题。使得用户可以通过语音输入进行模糊查询，得到系统中有用的信息，从的达到用户使用IVR的目的。

一种可实现语音重构的彩色复语谱图构建方法-201410688088.0
发明人：王双维;李广岩;梁士利;王春蕾;曹晓林;郑彩侠 -专利权人：东北师范大学
申请日： 2014-11-26 - 公布日： 2015-03-04 - 主分类号： G10L21/06
摘要：一种可实现语音重构的彩色复语谱图构建方法，本发明属于语音信号处理技术领域，本发明利用两个色彩通道分别表达傅里叶变换的实部和虚部，在R-G-B彩色空间中，R-B合成颜色的位置坐标对应傅里叶变换的实部和虚部，G值代表实部和虚部的符号组合。由R-G-B颜色配比可以解析出对应复数值的实部与虚部及其符号，通过对语谱图进行图像处理，然后重构语音，实现用图像处理技术对语音增强等目的，进行傅里叶逆变换，近而实现语音重构。

音频转换方法、立体移动结构和按摩器-201310108548.3

发明人：许泽新 -专利权人：许泽新

申请日： 2013-03-29 - 公布日： 2014-10-01 - 主分类号： G10L21/06

摘要：本发明涉及音频转换的技术领域，公开了音频转换方法、立体移动结构和按摩器，提供音频转换器，其内设有节奏信号辨别元件及旋律信号辨别元件，节奏信号辨别元件提取音频信号的节拍信号，并将节拍信号转换为随节拍信号变化的电信号；旋律信号辨别元件提取音频信号的音阶和升降调信号，并将音阶和升降调信号转换为随旋律信号变化的电信号。音频转换方法使得音频信号与运动完美协和在一起，实现移动体的立体随音乐的节奏和韵律移动效果，该结构运用在按摩器、婴儿摇篮/摇椅等装置中，对人体形成听觉和肢/身体感受协调统一的体验效果，用户的听觉及身体感受和谐统一，起到情绪安抚、提升音乐素养和开发胎儿/婴儿/幼儿音乐潜能的作用。

检测面部变化的方法和设备-201280015366.5

发明人： A·韦泰克;J·勒卡拉;A·韦赫考亚;J·韦尔霍;V·兰塔宁;V·苏拉卡;T·瓦尼拉;O·斯帕科夫 -专利权人：诺基亚公司

申请日： 2012-03-22 - 公布日： 2013-12-18 - 主分类号： G10L21/06

摘要：根据一个示例性实施例，提供了一种设备，该设备具有：耳机（110）；非接触式近程传感器（130），其布置成在用户（140）面部附近由所述耳机（110）支撑；以及传感器电路，其配置成引起输出指示所述非接触式近程传感器（130）与所述用户（140）面部之间的距离的暂时变化的信号。

专利分类

G 物理
G10 乐器；声学
 G10L 语音分析或合成；语音识别；音频分析或处理
 G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
 G10L21-02 .语音增强，例如降低噪声或消除回声
 G10L21-04 .时间压缩或扩展
 G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

专利文件下载

免登录下载普通用户下载升级VIP会员，免费下载

基于相关专利

创作和执行基于流程且基于约束的工作流的统一模型

无线传感器网络的混合入侵检测方法

色彩与任意光源匹配的、基于LED的照明模块

用于从水性体系中除去污染物的方法

用于提供基于任务的服务推荐的方法和装置

一种基于硬件排序MapReduce的数据处理方法

三维模型操纵和渲染

电平移位器电路

一种基于Actor模型的规则引擎系统及其方法

支持加密计算的微处理器流水线电路

音符相关专利

音符节奏教学卡

基于音频输入的动态调适音调校正

音调线生成方法和装置

音符序列生成方法及装置

一种歌曲数据处理方法及其设备

一种基于深度学习的钢琴和声自动编配系统及方法

一种编曲方法、装置及电子设备

基于音频输入的动态调适音调校正

基于上下文信息的音符向量的自动作曲系统及方法

音乐和弦识别方法及装置、电子设备、存储介质

时值相关专利

一种分区间的RPC超时值自适应调整方法

分布式流式数据处理的方法和装置

一种用于能源使用量的瞬时值超过限值的等级确定方法

一种分离式音符生成方法及装置

温度检测校正方法、装置及存储介质

一种音符时长显示方法、装置、电子设备及存储介质

一种探测器延时值获取方法、位同步方法及装置

一种单频网延时动态调整方法及装置

24字夜光钟面板

用溢出信号抑制数据传输的脉冲宽度调制

建模相关专利

一种面向制造领域的MDA建模工具的实现方法

一种基于统一建模环境的建模方法

一种统一建模平台

用于管理数据建模的系统及其方法

建模装置、建模方法以及建模程序

一种提供思维导图式的模型评价方法和系统

一种动态交互建模工具的实现方法及装置

电力设备建模方法、装置、计算机设备和存储介质

一种基于浏览器传输的建模方法及装置

数据建模方法、装置、存储介质及处理器

哼唱相关专利

哼唱编曲系统及其方法

通过哼唱音乐旋律搜索基于波形的音乐文件的方法和系统

分层递阶的歌曲旋律检索方法

一种应用移动终端搜索哼唱歌曲的方法及其移动终端

基于信息熵的音乐哼唱检测方法

一种基于数据级并行GPU加速的大规模哼唱旋律匹配系统

在线哼唱检索方法及系统

哼唱旋律到MIDI旋律的转换方法

一种哼唱识别方法及相关设备

一种基于LSTM与分层匹配的音乐哼唱检索方法及装置

方法相关专利

一种数据库读写分离的方法和装置

一种手机动漫人物及背景创作方法

一种通讯综合测试终端的测试方法

一种服装用人体测量基准点的获取方法

系统升级方法及装置

用于虚拟和接口方法调用的装置和方法

线程状态监控方法、装置、计算机设备和存储介质

一种JAVA智能卡及其虚拟机组件优化方法

检测程序中方法耗时的方法、装置及存储介质

函数的执行方法、装置、设备及存储介质

[发明专利]一种基于音符和时值建模的哼唱识谱方法及系统有效

专利文献下载