[发明专利]一种基于异常检测的婴儿哭声检测、网络建立方法和系统有效

专利信息
申请号: 202210794920.X 申请日: 2022-07-07
公开(公告)号: CN114863950B 公开(公告)日: 2023-04-28
发明(设计)人: 谭卫军 申请(专利权)人: 深圳神目信息技术有限公司
主分类号: G10L25/63 分类号: G10L25/63;G10L25/30;G10L25/03;G06N3/045;G06N3/0464;G06N3/084;G06N3/0895
代理公司: 北京维正专利代理有限公司 11508 代理人: 朱鹏程
地址: 518100 广东省深圳市龙华*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 异常 检测 婴儿 哭声 网络 建立 方法 系统
【权利要求书】:

1.一种基于异常检测的婴儿哭声检测方法,其特征在于,包括建立婴儿哭声检测系统并训练,将待检测声音文件输入训练好的婴儿哭声检测系统进行检测,判断包含哭声的概率,若概率大于设定阈值,则说明有哭声,若概率小于设定阈值,则说明无哭声;婴儿哭声检测系统包括声音预处理体系、特征提取骨干网络、特征优化分类网络;对婴儿哭声检测系统进行训练固化参数,包括:

获取哭声信号与正常声音信号,从哭声信号中截取单位长度的若干哭声段,分别进行频谱分析,得到若干哭声频谱二维图像并标记,将哭声频谱收集为第一样本集,从正常声音信号中截取单位长度的若干正常声音段,分别进行频谱分析,得到若干正常声音频谱二维图像并标记,将正常声音频谱收集为第二样本集,设置特征提取骨干网结构,用打标后的第一样本频谱、第二样本频谱训练特征提取骨干网,固定网络参数,得到参数固化后的特征提取骨干网络;采用包含有哭声的音频文件,输入训练好的特征提取骨干网络,进行特征提取,得到正样本的第三样本集,采用不包含哭声的音频文件,输入训练好的特征提取骨干网络,进行特征提取,得到负样本的第四样本集;将第三样本集中的多个第一CNN特征,组成第一特征包,为正样本包,将第四样本集中的多个第二CNN特征,组成第二特征包,为负样本包,采用多实例学习方法,将正样本包和负样本包输入特征优化分类网络进行训练,经过训练后,固定特征优化分类网络参数,得到训练好的特征优化分类网络;设置特征优化分类网络包括特征优化子网络和分类子网络,将特征提取骨干网输出的正负样本CNN特征,输入特征优化子网络进行特征优化,得到精细化特征,对精细化特征进行筛选,输入分类子网络进行分类,经过特征排序损失函数和分类损失计算,固化特征优化分类网络参数,完成训练。

2.根据权利要求1所述基于异常检测的婴儿哭声检测方法,其特征在于,设置特征提取骨干网络结构包括N层,每层设置输入通道数、输出通道数、核大小、步长,最顶层采用二维卷积层,中间层采用M层BlazeBlock结构、Q层全连接层,Q个全连接层分别与一个BlazeBlock结构连接,最后一层采用全连接层,将频谱二维图像输入最顶层,经过各层级联运算,并将各全连接层级联,得到一个K维的信号,将K维的信号输入最后一层全连接层,从最后一层全连接层输出一个二分类结果,提取到声音特征,其中M、N、Q是正整数,且Q是小于M的正整数,M是小于N的正整数。

3.根据权利要求1所述基于异常检测的婴儿哭声检测方法,其特征在于,将至少一个正样本第一特征,组成正样本包,送入特征优化和分类子网络,得到多个第一分类分数,取最大值作为第一分数;将至少一个负样本第二特征,组成负样本包,送入特征优化和分类子网络,得到多个第二分类分数,取最大值作为第二分数;对第一分数、第二分数进行排序损失函数和分类损失计算,固化特征优化分类网络参数。

4.根据权利要求1所述基于异常检测的婴儿哭声检测方法,其特征在于,将所有特征按时间均分为设定数量的段,若特征数量少于设定数量,采用插值方法增加到设定数量;若特征数量大于设定数量,则缩减至设定数量。

5.根据权利要求1所述基于异常检测的婴儿哭声检测方法,其特征在于,排序损失函数如下式所示:

式中,下标a表示正样本,即哭声样本,下标n表示负样本,即正常声音样本;函数f是段或实例的分类分数;Ba是正样本包,Bn是负样本包;表示正样本包中的第i个实例,表示负样本包中的第i个实例;λ1、λ2所在的两项是正则(regularization)项;采用CNN特征的幅值,进行多实例学习,从第一特征包中选择多个幅值最大或次大的CNN特征,作为第一特征幅值,从第二特征包中选择多个幅值最大或次大的CNN特征,作为第二幅值,将第一幅值、第二幅值输入分类子网络进行排序损失函数计算,采用反向传播方法,使函数输出值最小化。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳神目信息技术有限公司,未经深圳神目信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210794920.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top