[发明专利]音声数据检测装置、音声监控系统及其方法有效
申请号: | 201210045216.0 | 申请日: | 2012-02-24 |
公开(公告)号: | CN103295584A | 公开(公告)日: | 2013-09-11 |
发明(设计)人: | 刘昆;吴伟国 | 申请(专利权)人: | 索尼公司 |
主分类号: | G10L25/45 | 分类号: | G10L25/45;G10L25/87 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 郭定辉 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开音声数据检测装置、音声监控系统及其方法。该音声检测装置:音声数据接收部件,被配置为接收输入的音声数据流;音声数据处理部件,被配置为利用谱聚类方法对所述音声数据流进行分段处理,以将所述音声数据流分割为多个单一类型的音声数据段;以及声音检测部件,被配置为针对所述音声数据段提取检测特征,并利用预先建立的检测模型对该音声数据段的类型进行检测。 | ||
搜索关键词: | 数据 检测 装置 监控 系统 及其 方法 | ||
【主权项】:
一种音声数据检测装置,包括:音声数据接收部件,被配置为接收输入的音声数据流;音声数据处理部件,被配置为利用谱聚类方法对所述音声数据流进行分段处理,以将所述音声数据流分割为多个单一类型的音声数据段;以及声音检测部件,被配置为针对所述音声数据段提取检测特征,并利用预先建立的检测模型对该音声数据段的类型进行检测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210045216.0/,转载请声明来源钻瓜专利网。
- 上一篇:动力传递装置
- 下一篇:偏置双摆动从动件双斜盘端面凸轮关节轴承高速试验机
- 同类专利
- 基于语音时频变换特征和整数线性规划的录音终端聚类方法-201810735094.5
- 李艳雄;张雪;张聿晗;李先苦 - 华南理工大学
- 2018-07-06 - 2018-11-30 - G10L25/45
- 本发明公开了一种基于语音时频变换特征和整数线性规划的录音终端聚类方法,步骤如下:a、对读入的录音进行预处理;b、从每帧语音中提取GTCC特征;c、构造带瓶颈层的深度自编码网络并提取瓶颈特征;d、构造高斯超矢量特征;e、对a中预处理得到语音提取频谱图特征;f、将e中的频谱图特征拼接在d中的高斯超矢量之后,得到最后刻画录音终端特性的语音时频变换特征;g、利用整数线性规划算法对所有录音样本的语音时频变换特征进行聚类,将聚类结果作为最终的分类依据。本方法的特征提取和聚类均是无监督的,与目前有监督方法相比,更具普适性。
- 基于模式聚类和子空间算法的语音欠定盲恢复方法及装置-201810678323.4
- 黄翔东;徐婧文 - 天津大学
- 2018-06-27 - 2018-11-16 - G10L25/45
- 本发明公开了一种基于模式聚类和子空间算法的语音欠定盲恢复方法及装置,方法包括:对M路观测信号做加汉宁窗L点50%重叠的STFT变换,得到观测频谱;逐帧对STFT混合信号频谱做基于插值法的频谱校正操作,并对所有谐波参数对进行模式筛选;逐帧重复上一步骤,收集所有时间帧得到的SAS模式组成单源域;对单源域中的SAS模式进行数据密度聚类,得到估计的源数目及混合矩阵;根据估计出的源数目及混合矩阵,并通过子空间算法恢复源信号。装置包括:将采集到的多路观测信号经过A/D采样得到样本序列,以并行数字输入的形式输入进DSP芯片,经内部处理,得到混合矩阵的估计;借助输出驱动及其显示模块显示混合矩阵的估计值。
- 一种基于特征的音乐版权识别方法-201711377591.4
- 尹学渊;王东明;何林 - 成都嗨翻屋文化传播有限公司
- 2017-12-19 - 2018-04-27 - G10L25/45
- 本发明公开了一种基于特征的音乐版权识别方法,包括获取待识别音频文件,对所述音频文件分片处理,提取音频片段的音频指纹,遍历指纹库的音频指纹,将提取的音频片段的音频指纹与指纹库的音频指纹进行匹配,获得匹配结果;对所述匹配结果进行优化处理,包括统计出现相同时间差最多的指纹个数是否大于第一预设阈值,如果是,计算出现相同时间差最多的音频指纹持续时间;判断所述音频指纹持续时间是否大于第二预设阈值,如果是,分析音频指纹对应的时间点的个数;判断所述时间点的个数是否大于第三预设阈值,如果是,获得每个音频片段的识别结果;将每个音频片段的识别结果进行合并处理。本发明的音乐版权识别方法,识别准确度和识别率高。
- 一种基于分层可靠度变化趋势的音频分割方法-201610872916.5
- 杨新宇;王银瑞;丁建行;董怡卓;罗晶;杨泽正;王艺蒙;李雨墨 - 西安交通大学
- 2016-09-30 - 2017-08-01 - G10L25/45
- 本发明公开了一种基于分层可靠度变化趋势的音频分割方法,具体步骤包括1)定长分析窗内基于可靠度变化趋势的分层跳变点检测;2)基于定长分析窗内跳变点检测的音频分割。本发明采用定长分析窗来避免分窗检测导致的累积误差,在定长分析窗内根据可靠度变化趋势来检测声学跳变点以解决冗余点过多与硬判决的局限性问题,同时在定长分析窗内采用自顶向下的分层检测方式来避免跳变点漏检的情况,能够有效减少冗余分割点,提高综合性能。
- 音声数据检测装置、音声监控系统及其方法-201210045216.0
- 刘昆;吴伟国 - 索尼公司
- 2012-02-24 - 2013-09-11 - G10L25/45
- 本发明公开音声数据检测装置、音声监控系统及其方法。该音声检测装置:音声数据接收部件,被配置为接收输入的音声数据流;音声数据处理部件,被配置为利用谱聚类方法对所述音声数据流进行分段处理,以将所述音声数据流分割为多个单一类型的音声数据段;以及声音检测部件,被配置为针对所述音声数据段提取检测特征,并利用预先建立的检测模型对该音声数据段的类型进行检测。
- 专利分类
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置