[发明专利]一种基于异常检测的婴儿哭声检测、网络建立方法和系统有效
申请号: | 202210794920.X | 申请日: | 2022-07-07 |
公开(公告)号: | CN114863950B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 谭卫军 | 申请(专利权)人: | 深圳神目信息技术有限公司 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/30;G10L25/03;G06N3/045;G06N3/0464;G06N3/084;G06N3/0895 |
代理公司: | 北京维正专利代理有限公司 11508 | 代理人: | 朱鹏程 |
地址: | 518100 广东省深圳市龙华*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 异常 检测 婴儿 哭声 网络 建立 方法 系统 | ||
1.一种基于异常检测的婴儿哭声检测方法,其特征在于,包括建立婴儿哭声检测系统并训练,将待检测声音文件输入训练好的婴儿哭声检测系统进行检测,判断包含哭声的概率,若概率大于设定阈值,则说明有哭声,若概率小于设定阈值,则说明无哭声;婴儿哭声检测系统包括声音预处理体系、特征提取骨干网络、特征优化分类网络;对婴儿哭声检测系统进行训练固化参数,包括:
获取哭声信号与正常声音信号,从哭声信号中截取单位长度的若干哭声段,分别进行频谱分析,得到若干哭声频谱二维图像并标记,将哭声频谱收集为第一样本集,从正常声音信号中截取单位长度的若干正常声音段,分别进行频谱分析,得到若干正常声音频谱二维图像并标记,将正常声音频谱收集为第二样本集,设置特征提取骨干网结构,用打标后的第一样本频谱、第二样本频谱训练特征提取骨干网,固定网络参数,得到参数固化后的特征提取骨干网络;采用包含有哭声的音频文件,输入训练好的特征提取骨干网络,进行特征提取,得到正样本的第三样本集,采用不包含哭声的音频文件,输入训练好的特征提取骨干网络,进行特征提取,得到负样本的第四样本集;将第三样本集中的多个第一CNN特征,组成第一特征包,为正样本包,将第四样本集中的多个第二CNN特征,组成第二特征包,为负样本包,采用多实例学习方法,将正样本包和负样本包输入特征优化分类网络进行训练,经过训练后,固定特征优化分类网络参数,得到训练好的特征优化分类网络;设置特征优化分类网络包括特征优化子网络和分类子网络,将特征提取骨干网输出的正负样本CNN特征,输入特征优化子网络进行特征优化,得到精细化特征,对精细化特征进行筛选,输入分类子网络进行分类,经过特征排序损失函数和分类损失计算,固化特征优化分类网络参数,完成训练。
2.根据权利要求1所述基于异常检测的婴儿哭声检测方法,其特征在于,设置特征提取骨干网络结构包括N层,每层设置输入通道数、输出通道数、核大小、步长,最顶层采用二维卷积层,中间层采用M层BlazeBlock结构、Q层全连接层,Q个全连接层分别与一个BlazeBlock结构连接,最后一层采用全连接层,将频谱二维图像输入最顶层,经过各层级联运算,并将各全连接层级联,得到一个K维的信号,将K维的信号输入最后一层全连接层,从最后一层全连接层输出一个二分类结果,提取到声音特征,其中M、N、Q是正整数,且Q是小于M的正整数,M是小于N的正整数。
3.根据权利要求1所述基于异常检测的婴儿哭声检测方法,其特征在于,将至少一个正样本第一特征,组成正样本包,送入特征优化和分类子网络,得到多个第一分类分数,取最大值作为第一分数;将至少一个负样本第二特征,组成负样本包,送入特征优化和分类子网络,得到多个第二分类分数,取最大值作为第二分数;对第一分数、第二分数进行排序损失函数和分类损失计算,固化特征优化分类网络参数。
4.根据权利要求1所述基于异常检测的婴儿哭声检测方法,其特征在于,将所有特征按时间均分为设定数量的段,若特征数量少于设定数量,采用插值方法增加到设定数量;若特征数量大于设定数量,则缩减至设定数量。
5.根据权利要求1所述基于异常检测的婴儿哭声检测方法,其特征在于,排序损失函数如下式所示:
式中,下标a表示正样本,即哭声样本,下标n表示负样本,即正常声音样本;函数f是段或实例的分类分数;Ba是正样本包,Bn是负样本包;表示正样本包中的第i个实例,表示负样本包中的第i个实例;λ1、λ2所在的两项是正则(regularization)项;采用CNN特征的幅值,进行多实例学习,从第一特征包中选择多个幅值最大或次大的CNN特征,作为第一特征幅值,从第二特征包中选择多个幅值最大或次大的CNN特征,作为第二幅值,将第一幅值、第二幅值输入分类子网络进行排序损失函数计算,采用反向传播方法,使函数输出值最小化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳神目信息技术有限公司,未经深圳神目信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210794920.X/1.html,转载请声明来源钻瓜专利网。