[发明专利]一种电机声音频谱提取及可视化方法在审

专利信息
申请号: 202310392106.X 申请日: 2023-04-13
公开(公告)号: CN116469408A 公开(公告)日: 2023-07-21
发明(设计)人: 雷浩;沙万里;蒋宇轩;何天骄;王战;何星慰;林清;闻邦 申请(专利权)人: 浙江浙能嘉华发电有限公司;浙江浙能数字科技有限公司
主分类号: G10L21/14 分类号: G10L21/14;G01H17/00;G01R31/34;G06F17/14;G06V10/764;G06V10/774
代理公司: 杭州九洲专利事务所有限公司 33101 代理人: 张羽振
地址: 310009 浙江省杭州市上城*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种电机声音频谱提取及可视化方法,包括:采集电机声音;对电机声音进行分段处理、分帧处理和补零加窗处理;对分帧处理和补零加窗处理后的电机声音进行傅里叶变换,得到短时傅里叶变换频谱Spec;对短时傅里叶变换频谱Spec进行滤波,得到符合电机频谱特性的频谱;对频谱ESpec进行可视化,得到用于深度学习分类模型训练的三通道图像。本发明的有益效果是:本发明通过对电机声音采集、分段、分帧、加窗补零、傅里叶变换、滤波、可视化等操作可以获取符合电机特性的频谱图及可视化结果,方便使用深度学习的图像分类算法对电机声音进行识别。
搜索关键词: 一种 电机 声音 频谱 提取 可视化 方法
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江浙能嘉华发电有限公司;浙江浙能数字科技有限公司,未经浙江浙能嘉华发电有限公司;浙江浙能数字科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202310392106.X/,转载请声明来源钻瓜专利网。

同类专利
  • 一种电机声音频谱提取及可视化方法-202310392106.X
  • 雷浩;沙万里;蒋宇轩;何天骄;王战;何星慰;林清;闻邦 - 浙江浙能嘉华发电有限公司;浙江浙能数字科技有限公司
  • 2023-04-13 - 2023-07-21 - G10L21/14
  • 本发明涉及一种电机声音频谱提取及可视化方法,包括:采集电机声音;对电机声音进行分段处理、分帧处理和补零加窗处理;对分帧处理和补零加窗处理后的电机声音进行傅里叶变换,得到短时傅里叶变换频谱Spec;对短时傅里叶变换频谱Spec进行滤波,得到符合电机频谱特性的频谱;对频谱ESpec进行可视化,得到用于深度学习分类模型训练的三通道图像。本发明的有益效果是:本发明通过对电机声音采集、分段、分帧、加窗补零、傅里叶变换、滤波、可视化等操作可以获取符合电机特性的频谱图及可视化结果,方便使用深度学习的图像分类算法对电机声音进行识别。
  • 一种随音律跳动的水杯及的跳动显示方法-202211475043.6
  • 郑柳科;张洁 - 小水怪(深圳)智能科技有限公司
  • 2022-11-23 - 2023-03-28 - G10L21/14
  • 本发明涉及动态显示技术领域,具体涉及一种随音律跳动的水杯及的跳动显示方法,本发明提供一方面提供一种随音律跳动的显示方法,所述显示方法包括以下步骤:获取声音信息;采集所述声音信息的音频信号;控制器调取FFT函数,对采集的所述音频信号进行快速离散傅里叶变换,得到各个采样点的模值;对所述各个采样点的模值进行转换,获得各个采样点的幅值,所有采样点的幅值结果组成所述音频信号的幅值频谱;输出所述幅值频谱在点阵显示模块上进行显示。本发明提供了一种随音律跳动的水杯及的跳动显示方法,能够有效地解决便携式水杯仅具备简单的盛载、保温功能,作为高频使用的产品,其可互动性和趣玩性较差的问题。
  • 语音播放方法、装置及计算机可读存储介质-202210994672.3
  • 何海松;张伟彬 - 深圳市声扬科技有限公司
  • 2022-08-18 - 2022-12-30 - G10L21/14
  • 本申请实施例公开了一种语音播放方法、装置及计算机可读存储介质;可获取语谱图显示窗口中的频谱显示周期,以及获取语谱图显示窗口中语谱图的刷新周期;根据刷新周期及频谱显示周期,确定相邻两帧语谱图之间的增量语谱图时段和重叠语谱图时段;基于语音数据,计算增量语谱图时段对应的增量语谱图片段;获取重叠语谱图时段对应的历史语谱图片段,并按照语音播放时序对历史语谱图片段与增量语谱图片段进行融合,得到目标语谱图;根据目标语谱图和语音数据进行播放。以此,可实时刷新生成语谱图,提高语谱图的计算效率,有效避免语音播放过程中的卡顿和语谱图显示不完全的现象,提高用户的体验。
  • 基于目标检测的视唱音高检测方法、系统、设备及介质-202210656997.0
  • 许炜;杨未铭;王先科;李雨晴 - 华中科技大学
  • 2022-06-10 - 2022-10-18 - G10L21/14
  • 本发明公开了一种基于目标检测的视唱音高检测方法、系统、设备及介质,属于音频数据处理领域,方法包括:获取视唱音频并转换为二维声谱图,检测二维声谱图中各音符的起始时刻、结束时刻和音符下边界代表的频点索引;以第一音符的音符下边界代表的频点索引对应频率为中心,向上、向下分别容纳设定数量的频点为目标,确定第一音符的频点框的顶边频率值和底边频率值;在第一音符的顶边频率值和底边频率值之间的频率范围内,对起始时刻和结束时刻之间的二维声谱图中的每一帧进行峰值搜索,得到每一帧峰值对应的频率值;对第一音符中每一帧峰值对应的频率值求和取平均,得到其音高对应的平均频率以计算其的音高。提高视唱音高检索的精准度和效率。
  • 一种声音信号的频谱显示方法、装置、系统及存储介质-202111665743.7
  • 不公告发明人 - 乐鑫信息科技(上海)股份有限公司
  • 2021-12-31 - 2022-04-05 - G10L21/14
  • 本申请公开了一种声音信号的频谱显示方法,通过获取音源信号;将该音源信号进行频谱变换,得到频谱数据;采用听觉掩蔽效应模型,将频谱数据按照BARK谱的尺度分成子频带,分别计算每个子频带内的能量;基于每个子频带的能量进行噪声过滤,得到过滤后的频谱数据;对过滤后的频谱数据进行显示。本申请基于听觉掩蔽效应,采用BARK谱替代矩形子频带,对频谱数据进行子频带划分,不仅符合人耳心理声学特征,同时还能够过滤掉相邻频带之间的噪声,使得临界频带显示更为清晰,并且使得频谱显示带来的视觉观感与人耳的听感更加一致。此外,本申请还提供了一种具有上述技术效果的声音信号的频谱显示装置、系统以及计算机可读存储介质。
  • 音乐可视化的方法、装置及系统-201911004866.9
  • 闫震海 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2019-10-21 - 2022-02-22 - G10L21/14
  • 本发明实施例公开了一种音乐可视化方法,该方法包括:获取第一音频帧的第一功率谱;根据第一功率谱中各个频点的功率谱数据,确定第一功率谱的多个第一频点和第二频点;根据多个第一频点和第二频点,得到第一功率谱的第一频带;对第二频带做数轴映射得到第一压缩频带,第二频带为小于第一频带的最小频点的频率范围;对第三频带做数轴映射得到第二压缩频带,第三频带为大于第一频带的最大频点的频率范围;结合第一压缩频带、第二压缩频带和第一频带得到第一音频帧的第二功率谱。采用本发明实施例,可以针对不同音乐的个性化特征,为其量身定做一个有效的功率谱显示窗口,从而使音乐可视化效果更加符合人耳听感。
  • 音频播放方法及装置、电子设备及计算机可读存储介质-202111108837.4
  • 严笔祥 - OPPO广东移动通信有限公司
  • 2021-09-22 - 2021-12-14 - G10L21/14
  • 本申请公开了一种音频播放方法、音频处理装置、电子设备及非易失性计算机可读存储介质。音频播放方法包括:获取音频信号;识别音频信号的频段,频段与颜色信息相关联;及根据颜色信息控制电子设备的指示装置发光时的颜色。本申请实施方式的音频播放方法、音频处理装置、电子设备及非易失性计算机可读存储介质通过获取音频信号,并将音频信号的频段与颜色信息相关联,从而可以根据颜色信息以控制电子设备的指示装置发光时的颜色,由此,在电子设备播放音频时,用户则可通过指示装置发光时的颜色以直观的感知音频的频段,从而提高用户与电子设备之间的交互。
  • 一种音频驱动的动画特效的生成方法-202111014335.5
  • 杨健 - 亿览在线网络技术(北京)有限公司
  • 2021-08-31 - 2021-11-26 - G10L21/14
  • 本发明涉及一种音频驱动的动画特效的生成方法,当播放音频时,分批次获取当前播放中的音频对应的频谱数据,分奇数次、偶数次缓存于第一、第二缓存区;交替的从两个缓存区获取缓存的频谱数据,并生成频谱动画;并进一步判断下一批次的频谱数据是否已经被缓存;当未被缓存,则基于当前缓存的频谱数据,通过插帧补帧的处理逻辑,得到过渡频谱数据,并缓存于第三缓存区;通知下一批次的频谱数据获取临时改为从第三缓存区获取,并生成频谱动画。本发明,采用插帧补帧的处理逻辑,通过算法提高了帧率,避免刷新频率低于动画标准(一秒24帧),频谱动画更流畅,降低了动画的卡顿的情况。
  • 一种音频处理方法、装置、电子设备和存储介质-202110815319.X
  • 何创武 - 深圳市雷鸟网络传媒有限公司
  • 2021-07-19 - 2021-11-02 - G10L21/14
  • 本发明实施例公开了一种音频处理方法、装置、电子设备和存储介质;本发明实施例可以获取音频对应的频率数据,基于所述频率数据进行能量计算,得到所述音频对应的能量波动数据,基于所述频率数据进行频率幅度计算,得到所述音频对应的频率幅度波动数据,根据所述能量波动数据生成与所述音频对应的能量波动图像,以及根据所述频率幅度波动数据生成与所述音频对应的频率幅度波动图像,对所述能量波动图像和所述频率幅度波动图像进行显示;因此,通过本发明实施例可以将听觉感受上的音乐频率转化为视觉感受上的能量波动图像和频率波动图像,实现音频的可视化。
  • 一种录音频谱显示方法及终端设备-201910473309.5
  • 马子平 - 维沃移动通信有限公司
  • 2019-05-31 - 2021-08-27 - G10L21/14
  • 本发明提供一种录音频谱显示方法及终端设备,该方法包括:获取录音信息;在确定所述录音信息中包括至少两个声纹特征信息的情况下,对不同声纹特征信息对应的录音频谱进行分色渲染;显示第一录音频谱,所述第一录音频谱中包括分色渲染后的各声纹特征信息对应的录音频谱。本发明实施例可以提升录音频谱的显示效果。
  • 声源分布可视化方法及电脑程式产品-201911186137.X
  • 王智中 - 睿捷国际股份有限公司
  • 2019-11-28 - 2021-05-28 - G10L21/14
  • 本发明提供一种声源分布可视化方法及电脑程式产品,其方法包括:读取检测目标的一目标影像;在目标影像标示一检测边界及在检测边界设置多个检测点,各检测点具有专属编码;对应各检测点输入检测目标运作过程产生的一物理信号;通过频谱叠加计算各物理信号的频谱分布,分析各物理信号的频宽范围,并且通过一分析运算处理取得各物理信号的频宽范围内的时间波形,以产生各物理信号的一特征信号;以及将各特征信号通过一神经网路运算,形成可视化特征的一影像声源分布,影像声源分布配合目标影像呈现于检测边界中;借此,能够即时、快速且准确取得声源分布。
  • 一种声学成像方法-202011174825.7
  • 曹祖杨;张凯强;包君康;崔二朋 - 杭州兆华电子有限公司
  • 2020-10-28 - 2021-01-19 - G10L21/14
  • 本发明涉及的是一种声学成像方法,解决了一般噪声检测需要较大算力,且不能进行调整以适应不同算力条件系统的问题,包括以下步骤:通过麦克风采集原始音频数据;对原始音频数据进行数据处理,得到声源强度分布图;通过摄像头采集图像信息;将声源强度分布图与图像信息融合得到声学成像图片。本发明的有益效果是:通过声源强度分布图与拍摄图像的结合实现声音强度可视化、具体化;采用修正矩阵校准修正声源强度分布矩阵的计算偏差,排出不必要的干扰使结果更为精确;将高倍插值处理放于FFT处理之后,减轻了算力压力,同时也保证了分辨率;精简优化的流程使用小型轻量的载体装置也可实现,能够适用更多的应用场景。
  • 一种远程声音信号处理分析装置-201711209266.7
  • 张珍华 - 张珍华
  • 2017-11-27 - 2019-06-04 - G10L21/14
  • 本发明公开了一种远程声音信号处理分析装置,包括装置本体和底座,所述电源连接口外顶端安装有电源插头,所述装置本体一侧外表面上顶端安装有调节旋钮,所述调节旋钮左侧安装有波段显示屏,所述装置本体一侧外表面中心位置处一边缘端安装有调节按钮,所述调节按钮左端位置处安装有波频显示器,所述装置本体内部下底面一侧安装有终端无线接收模块,所述装置本体内部下底面另一侧安装有声音信号传感器,所述声音信号传感器正上方安装有信号处理模块,所述底座上表面转动连接有罩子,所述罩子上表面焊接固定有固定杆,所述固定杆上顶端安装有信号接收器。该远程声音信号处理分析装置,有效对远程声音信号进行接收处理。
  • 声音便携设备的显示装置-201580062557.0
  • 香田进 - 日商·来思公司
  • 2015-12-16 - 2017-08-29 - G10L21/14
  • 目的在于提供一种能够对从外部读入而存储于声音便携设备主体的音源的频带和利用该声音便携设备主体重放的频带进行比较显示的声音便携设备的显示装置。具备音源文件18,存储外部的音源数据;该音源文件18的音源数据的重放单元14;重放机种的数据的设备数据存储器16;控制器15,控制各电路之间;所述音源文件18的音源数据的采样率输出21;重放采样率输出23,输出所述重放采样率;音源输出显示部12,显示所述采样率输出21;以及重放输出显示部13,显示所述重放采样率输出23。
  • 显示音频信息的方法和装置-201610799030.2
  • 呼伦夫 - 天脉聚源(北京)科技有限公司
  • 2016-08-31 - 2017-02-01 - G10L21/14
  • 本发明公开了一种显示音频信息的方法和装置,属于通信领域。所述方法包括预先生成螺旋形状模型;实时采集音频信息,并解析所述音频信息得到频率;按照预设的对应关系,将所述频率转换为对应的螺旋角;显示所述螺旋形状模型,将所述螺旋形状模型的螺旋角调整为所述转换得到的螺旋角。所述装置包括生成模块、采集模块、转换模块和调整模块。本发明能够在画面上显示出音频信号的变化,更清晰直观,克服了传统展示方式单一、沉闷的局限性,提高了音频信息的展示效果,极大地提升了用户体验。
  • 显示音频信息的方法和装置-201610798581.7
  • 呼伦夫 - 天脉聚源(北京)科技有限公司
  • 2016-08-31 - 2017-01-18 - G10L21/14
  • 本发明公开了一种显示音频信息的方法和装置,属于通信领域。所述方法包括预先生成包括多种颜色的彩虹形状模型;实时采集音频信息,并解析所述音频信息得到频率;按照预设的对应关系,将所述频率转换为对应的颜色;显示所述彩虹形状模型,在所述彩虹形状模型中找到所述颜色且突出显示。所述装置包括生成模块、采集模块、转换模块和控制模块。本发明能够在画面上显示出音频信号的变化,更清晰直观,克服了传统展示方式单一、沉闷的局限性,提高了音频信息的展示效果,极大地提升了用户体验。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top