[发明专利]一种基于多边形质心的频谱趋势计算方法在审

专利信息
申请号: 202211611322.0 申请日: 2022-12-14
公开(公告)号: CN116129933A 公开(公告)日: 2023-05-16
发明(设计)人: 纪建军 申请(专利权)人: 力声智能科技(苏州)有限公司
主分类号: G10L21/06 分类号: G10L21/06;G10L21/10;G10L25/51
代理公司: 上海德悦知识产权代理事务所(普通合伙) 31344 代理人: 吴庆
地址: 215537 江苏省*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于多边形质心的频谱趋势计算方法,涉及信号转换领域,包括以下步骤:S1:通过对应的信号收集装置采集原始信号变化;S2:将收集到的原始信号导入转换设备,生成二维曲线图谱;S3:将曲线二维图谱分为若干段,并取其中一段得到一段关注段;S4:求得关注段质心;S5:重复S3与S4操作步骤,得到若干段关注段的质心;S6:按时间得到质心变化趋势以代表原始信号的变化趋势。本发明通过在二维图谱中截取若干个关注段,并得出每个关注段的质点,并将若干个质点相连,得出与原始信号走势一致的质点图谱,再设定阈值与质点图谱进行比对,则可以进一步降低运算量,并且快速得出诊断结论,更加快捷方便。
搜索关键词: 一种 基于 多边形 质心 频谱 趋势 计算方法
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于力声智能科技(苏州)有限公司,未经力声智能科技(苏州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202211611322.0/,转载请声明来源钻瓜专利网。

同类专利
  • 一种基于声学参量阵的听障患者听声辩位适应装置-202310379120.6
  • 李俊飞 - 南昌职业大学
  • 2023-04-11 - 2023-08-08 - G10L21/06
  • 本发明公开了一种基于声学参量阵的听障患者听声辩位适应装置,其可拆卸的安装于帽体上,包括多个依次串联且可独立拆卸的连接组件,位于两端的连接组件可拆卸的连接于帽体上,位于两端、位于中部的连接组件的靠外一侧设置有声学参量阵,位于两端、位于中部的连接组件的靠内一侧设置有自振组件,所述自振组件能够根据所述声学参量阵的反馈选择性进行震荡动作。
  • 音频数据处理方法、装置、设备以及计算机存储介质-202210692527.X
  • 柳慧芬;周国强;沈古月 - 武汉市聚芯微电子有限责任公司
  • 2022-06-17 - 2023-05-16 - G10L21/06
  • 本申请实施例公开了一种音频数据处理方法、装置、设备以及计算机存储介质,该方法包括:获取待处理的音频数据;对音频数据进行音效起始点检测,确定音效起始帧;根据音效起始帧以及之后连续的若干帧对应的频谱数据,确定二维频谱数据;从二维频谱数据中选择与触觉效果对应的目标区域,以及对目标区域进行与触觉效果对应的特征分析,确定至少一个目标音效;根据至少一个目标音效,确定音频数据对应的触觉效果数据。这样,通过对音频数据进行音效起始点检测和音效分析,确定音频数据对应的触觉效果数据,从而能够实现音频数据向触觉效果数据的转换,增强触觉感知效果。
  • 一种基于多边形质心的频谱趋势计算方法-202211611322.0
  • 纪建军 - 力声智能科技(苏州)有限公司
  • 2022-12-14 - 2023-05-16 - G10L21/06
  • 本发明公开了一种基于多边形质心的频谱趋势计算方法,涉及信号转换领域,包括以下步骤:S1:通过对应的信号收集装置采集原始信号变化;S2:将收集到的原始信号导入转换设备,生成二维曲线图谱;S3:将曲线二维图谱分为若干段,并取其中一段得到一段关注段;S4:求得关注段质心;S5:重复S3与S4操作步骤,得到若干段关注段的质心;S6:按时间得到质心变化趋势以代表原始信号的变化趋势。本发明通过在二维图谱中截取若干个关注段,并得出每个关注段的质点,并将若干个质点相连,得出与原始信号走势一致的质点图谱,再设定阈值与质点图谱进行比对,则可以进一步降低运算量,并且快速得出诊断结论,更加快捷方便。
  • 一种振动马达的控制方法、装置、存储介质和电子设备-202210732508.5
  • 王洪兴;张玉蕾 - 瑞声开泰声学科技(上海)有限公司
  • 2022-06-27 - 2022-10-18 - G10L21/06
  • 本发明实施例提供了一种振动马达的控制方法、装置、存储介质和电子设备。该方法包括:获取音频内容对应的音频信号;对音频信号进行处理,生成处理后的音频信号;识别出处理后的音频信号的空间信息;基于空间信息,生成振动马达的控制参数;根据控制参数,向振动马达输出控制参数对应的振动信号,以对振动马达进行控制。本发明实施例提供的技术方案中,基于空间信息实现了对声音空间感的效果的增强,提供给使用者更加沉浸式的体验。
  • 一种触感感应和手指组合发声的聋哑人沟通方法及系统-202210450921.2
  • 陈闻杰;李文;曹淇俊 - 华东师范大学
  • 2022-04-24 - 2022-09-06 - G10L21/06
  • 本发明公开了一种触感感应和手指组合发声的聋哑人沟通方法,所述沟通方法包括通过将声音转化为触感信息实现“听”的过程,和通过将手指按键操作转化为声音实现“说”的过程。本发明还提供了一种实现上述沟通方法的系统,所述系统中,采样主板负责声音信息和按键信息的采集及交互执行,传感模块用于按键操作的输入和触感信息的输出,移动端设备负责语音识别、语音合成、查“音素组合‑手指信息对照表”的信息处理。本发明所述的系统和方法相较传统手语翻译方法具有较好语义表达的确定性、稳定性和交互实时性,无需昂贵的采集设备,成本较低,同时易于推广。
  • 异常音的发生部位确定方法以及应用程序-202210069211.5
  • 茨木理 - 丰田自动车株式会社
  • 2022-01-21 - 2022-08-12 - G10L21/06
  • 本发明提供一种异常音的发生部位确定方法以及应用程序。CPU操作扬声器,选择并再现成为异常音的发生部位的候选的声音的频率分量。CPU将与再现的声音中的经由触摸面板指示的声音对应的频率作为指示频率。CPU从针对将对象物体分割为多个而得到的各个区域靠近配置便携终端时所录音的声音数据抽出指示频率分量,计算其声压等级。CPU将声压等级成为最大的区域的声音数据发送给解析装置。解析装置根据接收到的声音数据来确定异常音的发生部位。
  • 手语视频生成方法、电子设备及计算机可读存储介质-201910677689.4
  • 赵璐;莫东松;张进;钟宜峰;张健;马晓琳;马丹 - 咪咕文化科技有限公司
  • 2019-07-25 - 2022-03-22 - G10L21/06
  • 本发明实施例涉及手语翻译技术领域,公开了一种手语视频生成方法、电子设备及计算机可读存储介质,所述手语视频生成方法包括:获取语音的第一类特征参数;将所述第一类特征参数输入预设神经网络模型,得到手语视频的关键帧,其中,所述预设神经网络模型通过历史手语视频中语音的第一类特征样本参数及视频图像的第二类特征样本参数训练得到;根据所述关键帧生成所述语音对应的手语视频。本发明提供的手语视频生成方法、电子设备及计算机可读存储介质能够生成连贯性强的手语视频。
  • 用于提供通过触觉刺激增强的音乐或语音或声音音频感知的方法和系统-202080014411.X
  • 吉安卡罗·阿玛迪奥 - IG科技阿玛迪奥吉安卡罗股份有限公司
  • 2020-02-11 - 2021-10-08 - G10L21/06
  • 描述了一种用于提供通过触觉刺激增强的音乐或语音或声音音频感知的方法。所述方法包括以下步骤:接收代表所述音乐或语音或声音音频的信号(S、SE);同时生成一个或更多个触觉刺激(ST);然后基于前述接收信号(S或SE)调制所述一个或更多个触觉刺激(ST),以生成一个或更多个经调制的触觉刺激STM。然后,该方法设想将前述一个或更多个经调制的触觉刺激(STM)与音乐或语音或声音音频的声音扩散一起施加在聆听者身上,使得聆听者可以通过听觉刺激和通过触觉刺激来享受音乐或语音或声音音频。此外,描述了能够实现前述方法的用于提供通过触觉刺激增强的音乐或语音或声音音频感知的相应系统1。
  • 一种基于生成对抗网络的人脸视频合成方法及装置-202110236535.9
  • 刘亚志;田裕;李伟;杨志刚;黄永生 - 华北理工大学
  • 2021-03-03 - 2021-06-22 - G10L21/06
  • 本申请实施例属于图像处理技术领域,涉及一种基于生成对抗网络的人脸视频合成方法及装置。此外,本申请还涉及区块链技术,用户的当前音频数据以及目标人脸视频可存储于区块链中。本申请通过在人脸图像的生成质量上进行对抗训练,以“f‑散度评估”生成数据分布与真实数据分布之间的差异,在增加模型损失收敛速度的同时提高了网络模型对人脸图像视频帧的生成效果。此外本公开为了验证视频帧序列与音频的对齐问题,使用条件对抗网络把音频序列作为条件,输入到视频帧序列判别网络中以提高序列同步的准确性。
  • 一种基于音乐频率的振动频率设计方法-202011558960.1
  • 张燕昕;郑亚军 - 瑞声光电科技(常州)有限公司;瑞声声学科技(深圳)有限公司
  • 2020-12-25 - 2021-04-16 - G10L21/06
  • 本发明提供了一种基于音乐频率的振动频率设计方法,包括以下步骤:S1:预先设置一组量化模块,包括:个性输入量化模块;音乐特征量化模块;振动效果量化模块;S2:用户个性化参数输入,通过个性输入量化模块,获取个性输入的具体量化值;S3:提取音乐信号的音乐特征,通过音乐特征量化模块,获取音乐特征的具体量化值;S4:量化计算,按照公式进行计算,获取振动效果频率相对值;S5:通过振动效果量化模块,将振动效果频率相对值进行映射,获取振动效果频率绝对值;S6:马达基于振动效果频率绝对值播放振动。本发明的振动频率设计方法实现了听觉上的音乐频率到触觉上的振动频率完美转换,为设计人员或者用户提供了高效、丰富的触觉体验。
  • 声音可视化方法及装置、存储介质、MR混合现实设备-202010948238.2
  • 谢迪 - 珠海格力电器股份有限公司
  • 2020-09-10 - 2021-01-05 - G10L21/06
  • 本发明公开了一种声音可视化方法及装置、存储介质、MR混合现实设备,所述方法包括:实时监测目标环境中的声音信号,其中,所述目标环境为MR混合现实设备所在环境;将监测到的声音信号与预存的多种参考声音进行对比,根据对比结果确定监测到的声音信号所属的类型;从监测到的声音信号中筛选出待转换的声音信号;根据监测到的声音信号的类型,将待转换的声音信号转换成与其内容对应的可视化信息,并将该可视化信息与现实场景融合显示,将声音可视化与MR混合现实技术结合起来,能够在现实场景中呈现可视化信息,在不影响听障人士的现实生活的前提下,还能够帮助听障人士感受周围环境的声音。
  • 对网络路径进行区域化解析的系统和方法-201880086986.5
  • 克里斯托弗·安东尼·席尔瓦 - 克里斯托弗·安东尼·席尔瓦
  • 2018-07-26 - 2020-10-20 - G10L21/06
  • 用于基于特定声音或者基于词语、短语和/或声音的特定组合将网络路径区域化解析到一个或多个文件类型的系统和方法。联网设备处利用用户接口的应用可以经由高级程序员接口(API)访问远程语音到文本服务器,并且可以访问区域化的可访问数据库。区域化的可访问数据库可以包括与不同网络路径相关联的对不同词语、短语和声音的文本翻译以及条目对其有效的区域。在全局数据库处查询处于可搜索格式的经转换音频和联网设备的位置以找到匹配,如果针对查询在区域化数据库中找到匹配,则将与该匹配相关联的网络路径从区域化数据库返回到联网设备,并且在联网设备处打开与返回的网络路径相关联的一个或多个文件。
  • 一种手机端发音可视化系统的实现方法-202010344324.2
  • 徐天一;赵隆轩;王建荣;于瑞国;于建;高洁;严丽珺 - 天津大学
  • 2020-04-27 - 2020-08-18 - G10L21/06
  • 本发明公开一种手机端发音可视化系统的实现方法,包括步骤:建立发音运动数据库,提取语音数据的特征使语音数据能转换为机器所能处理分析的特征向量形式,然后与原始数据共同组成数据集;利用上述数据集对选择的GMM模型进行训练,得到发音可视化模型;将所述发音可视化模型与预创建的声音录入模块与可视化处模块连接,应用到移动平台,形成手机端发音可视化系统。本发明所形成的手机端发音可视化系统,应用于手机等移动平台上,可以实现发音动作可以移动平台,如手机显示面上的可视化显示,通过直观的展示方便了解相应的使用者的语音的发音动作。
  • 语音转化手写笔迹的方法和装置-201610571390.7
  • 李纯冬 - 广州视睿电子科技有限公司;广州视源电子科技股份有限公司
  • 2016-07-18 - 2019-07-09 - G10L21/06
  • 本发明涉及一种语音转化手写笔迹的方法和装置,语音转化手写笔迹的方法,包括以下步骤:在接收到用户输入的语音数据时,对语音数据进行语音识别处理,得到语音数据对应的语音内码;在笔迹数据库中对语音内码进行检索,在检索到与语音内码对应的笔迹内码时,从笔迹数据库中获取笔迹内码对应的手写笔迹的关键数据;关键数据包括手写笔迹的以下数据中的任意一种或任意组合:轨迹数据、截图数据和矢量图形数据;对关键数据进行笔迹还原处理,得到手写还原笔迹。本发明使得用户在可书写设备上进行书写时,可以通过语音输入,将语音数据转化成书写笔迹进行补充,过程简单,使用方便。
  • 警示音离线识别方法及装置-201810422085.0
  • 张立新 - 深圳市沃特沃德股份有限公司
  • 2018-05-04 - 2018-11-16 - G10L21/06
  • 本发明提出的警示音离线识别方法及装置,其中方法包括:获取当前声音的数字信号;将所述数字信号与预存的警示音语音库进行匹配,得到匹配的警示音;根据所述警示音语音库预先匹配的震动类型表,调用与所述警示音相对应的震动类型;根据所述震动类型产生相对应的第一震动。本发明提供一种适用于听力障碍者的警示音离线识别方法及装置。
  • 一种基于音符和时值建模的哼唱识谱方法及系统-201410066451.5
  • 曾新;徐明;王利斌 - 曾新;徐明;王利斌
  • 2014-02-26 - 2017-02-15 - G10L21/06
  • 本发明适用于计算机应用技术领域,提供了一种基于音符和时值建模的哼唱识谱方法,本发明建立有包括音符音高模型集和音符时值模型集在内的乐理高斯混合模型库,所述乐理高斯混合模型库中的所有模型均事先通过乐理高斯混合模型训练单元进行模型参数训练,并可选用乐理高斯混合模型重估训练单元进行模型参数的重估训练,哼唱识谱时,对采集的用户哼唱语音分别进行音高特征提取、乐理信息解码识别、节拍提取、乐理处理与变换,最后输出成标准乐谱。本发明方法设计的哼唱识谱系统识别率高、稳定性好,还能适应个人的唱歌行为特点,可作为专业人员或音乐爱好者的创作助手和备用工具,具有推广应用价值和产业化前景。
  • 创新工作室应用系统-201620435230.5
  • 徐尧 - 中国共产党普洱市纪律检查委员会
  • 2016-05-13 - 2016-11-16 - G10L21/06
  • 本实用新型公开一种创新工作室应用系统,属会议室应用系统技术领域,其特征在于,应用系统由设备区域和讨论区域构成,所述设备区域包括录音录像设备、存储设备和处理设备,录音录像设备中的数个麦克风预先放置于在讨论区域内,录音录像设备通过无线或有线对讨论区域进行声音或视频实时传输到存储设备中存储,处理设备将存储设备内的音频内容实时转换成文字信号,将并文字信号实时显示在屏幕或者显示器上。讨论结束后,处理设备将存储设备的音频内容转换成文本内容记录下来。本实用新型提供的创新工作室的应用系统现代化、智能化,保证讨论者在工作室内全心参与讨论,更大地发挥思考空间,改善讨论效果,提高集体的创新能力。
  • 一种语音处理方法及装置-201410838240.9
  • 王朝民;冯俊兰 - 中国移动通信集团公司
  • 2014-12-29 - 2016-07-27 - G10L21/06
  • 本发明提供了一种语音处理方法及装置。所述语音处理方法,包括:对热线语音数据进行处理,获取所述热线语音数据的文本信息以及热线语音数据中涉及的用户语音信息;根据所述文本信息以及用户语音信息,获取所述热线语音数据的评价结果。上述方案,结合语音数据中的文本信息以及语音信息对客服服务的用户满意度进行评价,能够更加全面更加细致的评价客服录音的用户满意度情况,扩大了满意度评价的对象规模,同时节省了人力成本,更好的为客服热线运营提供技术支撑。
  • 一种正常人与聋、哑、盲人群的对话装置及其使用方法-201510258510.3
  • 张开生;韦逸野;王静 - 陕西科技大学
  • 2015-05-20 - 2015-08-12 - G10L21/06
  • 一种正常人与聋、哑、盲人群的对话装置,包括有微处理器,微处理器内设有语音处理器和语音转换器,语音处理器通过语音识别装置与音频放大器相连;语音处理器的输出端通过盲文转换器A与阵列驱动器相连;语音转换器的输出端与语音播放器相连;语音转换器的输入端通过盲文转换器B与盲文书写装置相连;通过微处理器将正常人的语音信息转换成汉字信息,并结合汉字再转化成盲文信息,将盲文信息通过相应的阵列驱动器转换成对应盲文凸凹阵列,供聋、哑、盲人群触摸感知;聋、哑、盲人与常人对话时,在对话装置上书写盲文,将盲文转换成对应语音播放给正常人;解决了聋、哑、盲人群不能与正常人进行语言交流问题。
  • 交互式语音应答业务中的语音识别方法及装置-201310698758.2
  • 李志明 - 中兴通讯股份有限公司
  • 2013-12-18 - 2015-06-24 - G10L21/06
  • 本发明提供了一种交互式语音应答业务中的语音识别方法及装置,其中,该方法包括:获取终端用户的语音信息;将所述语音信息转换为第一文件信息;根据所述第一文件信息按照预设规则获取第二文件信息,将所述第二文件信息作为所述语音信息的识别结果。采用本发明提供的上述技术方案,解决了相关技术中,尚无有效的技术方案实现交互式语音应答IVR业务的问题。使得用户可以通过语音输入进行模糊查询,得到系统中有用的信息,从的达到用户使用IVR的目的。
  • 一种可实现语音重构的彩色复语谱图构建方法-201410688088.0
  • 王双维;李广岩;梁士利;王春蕾;曹晓林;郑彩侠 - 东北师范大学
  • 2014-11-26 - 2015-03-04 - G10L21/06
  • 一种可实现语音重构的彩色复语谱图构建方法,本发明属于语音信号处理技术领域,本发明利用两个色彩通道分别表达傅里叶变换的实部和虚部,在R-G-B彩色空间中,R-B合成颜色的位置坐标对应傅里叶变换的实部和虚部,G值代表实部和虚部的符号组合。由R-G-B颜色配比可以解析出对应复数值的实部与虚部及其符号,通过对语谱图进行图像处理,然后重构语音,实现用图像处理技术对语音增强等目的,进行傅里叶逆变换,近而实现语音重构。
  • 音频转换方法、立体移动结构和按摩器-201310108548.3
  • 许泽新 - 许泽新
  • 2013-03-29 - 2014-10-01 - G10L21/06
  • 本发明涉及音频转换的技术领域,公开了音频转换方法、立体移动结构和按摩器,提供音频转换器,其内设有节奏信号辨别元件及旋律信号辨别元件,节奏信号辨别元件提取音频信号的节拍信号,并将节拍信号转换为随节拍信号变化的电信号;旋律信号辨别元件提取音频信号的音阶和升降调信号,并将音阶和升降调信号转换为随旋律信号变化的电信号。音频转换方法使得音频信号与运动完美协和在一起,实现移动体的立体随音乐的节奏和韵律移动效果,该结构运用在按摩器、婴儿摇篮/摇椅等装置中,对人体形成听觉和肢/身体感受协调统一的体验效果,用户的听觉及身体感受和谐统一,起到情绪安抚、提升音乐素养和开发胎儿/婴儿/幼儿音乐潜能的作用。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

tel code back_top