[发明专利]一种婴儿啼哭原因的预测方法及装置在审

专利信息
申请号: 201811592904.2 申请日: 2018-12-25
公开(公告)号: CN109509484A 公开(公告)日: 2019-03-22
发明(设计)人: 鲍晓 申请(专利权)人: 科大讯飞股份有限公司
主分类号: G10L25/18 分类号: G10L25/18;G10L25/21;G10L25/72;G06K9/00
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 张小娜;王宝筠
地址: 230088 安徽*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请公开了一种婴儿啼哭原因的预测方法及装置,该方法包括:首先,通过对目标婴儿的音频和视频进行同步录制,获取目标婴儿在啼哭时段内的原始音频数据与原始视频数据,并分别作为目标音频数据与目标视频数据,其中,原始视频数据包括目标婴儿的面部特写视频数据和/或行为动作视频数据,接着,可以根据获取到的目标音频数据与目标视频数据,预测出目标婴儿的啼哭原因。可见,本申请在预测目标婴儿的啼哭原因时,将目标婴儿在啼哭时段内的音频数据和视频数据相结合,能够更准确地预测出目标婴儿的啼哭原因。
搜索关键词: 婴儿 视频数据 目标视频数据 目标音频数据 原始视频数据 预测 原始音频数据 获取目标 同步录制 行为动作 音频数据 预测目标 申请 视频
【主权项】:
1.一种婴儿啼哭原因的预测方法,其特征在于,包括:通过对目标婴儿的音频和视频进行同步录制,获取所述目标婴儿在啼哭时段内的原始音频数据与原始视频数据,分别作为目标音频数据与目标视频数据,所述原始视频数据包括所述目标婴儿的面部特写视频数据和/或行为动作视频数据;根据所述目标音频数据与所述目标视频数据,预测所述目标婴儿的啼哭原因。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811592904.2/,转载请声明来源钻瓜专利网。

同类专利
  • 基于核主成分分析改进Mel滤波器的语音特征提取方法-201710100827.3
  • 张毅;倪雷 - 重庆邮电大学
  • 2017-02-23 - 2019-11-12 - G10L25/18
  • 本发明公开了一种基于核主成分分析改进Mel滤波器的语音特征提取方法包括步骤:S1,对初始输入语音信号数字化采样、预加重和分帧加窗等处理得到预处理后的语音信号;S2,根据伽马通滤波器特性计算处理后语音信号的伽马通滤波倒谱系数特征;S3,提取伽马通滤波倒谱系数的滑动差分;S4,计算预处理语音信号的基音频率;S5,根据融合公式对伽马通滤波倒谱系数、滑动差分和基音频率进行特征数据融合;S6,根据核主成分分析对数据融合后语音特征转换降维。本发明可获得更具鲁棒性的特征参数。
  • 一种车载仪表蜂鸣检测方法、装置及系统-201910470586.0
  • 戴锐;黄振娟;陈文 - 惠州市德赛西威汽车电子股份有限公司
  • 2019-05-31 - 2019-10-25 - G10L25/18
  • 本发明涉及机动车测试技术领域,尤其涉及一种车载仪表蜂鸣检测方法、装置及系统。所述方法包括:接收从预设样机发出的蜂鸣信号;对蜂鸣信号进行信号转换,得到相对应的第一音频信号;对第一音频信号进行解析处理,得到预设样机的蜂鸣参数。本发明通过接收预设样机的蜂鸣信号,并对进行转换为可处理的音频电信号,通过解析音频电信号从而得到需要检测的预设样机的蜂鸣参数信息,接收解析过程通过采集模块与控制模块进行处理,不需要测试人工进行检测,节省了人工成本,同时可检测出人工测量不容易获取的频率和周期参数,实现对蜂鸣器全方面的检测,提高了测试效率,保证检测精度的同时缩短了测试的周期,大大的降低了检测成本。
  • 一种基于完整局部二进制模式的伪装语音检测方法-201910396609.8
  • 简志华;徐剑;郭珊;金易帆 - 杭州电子科技大学
  • 2019-05-14 - 2019-08-20 - G10L25/18
  • 本发明涉及基于完整局部二进制模式的伪装语音检测方法,包括:对真实语音库和相应的伪装语音库中所有语音进行变量Q变换,得到所有真实语音和伪装语音的语谱图;分别将各语谱图转换为相应的灰度图像,并采用完整局部二进制模式处理,生成相应的纹理特征;将所有的纹理特征作为训练支持向量机的训练集,训练得到支持向量机;将待识别语音输入至支持向量机,以进行伪装语音的识别。本发明采用变量Q变换获取的语谱图,纹理更加清晰,有助于提取语音信号的纹理特征;而且采用完整局部二进制模式,包含语谱图的局部符号差值信息和局部幅度差值信息,可更全面地获取信号的纹理特征,有利于支持向量机的分类,提高识别伪装语音的准确率。
  • 基于beta-VAE和i-vector的多对多语音转换方法-201910323677.1
  • 李燕萍;张成飞;许吉良;张燕 - 南京邮电大学
  • 2019-04-22 - 2019-08-02 - G10L25/18
  • 本发明公开了一种基于beta‑VAE和i‑vector的多对多语音转换方法,通过引入可调节参数β和C对变分自动编码器(VAE)框架进行了修改,并将i‑vector(身份特征向量)与改进后的VAE网络结合起来,提高隐变量解纠缠能力,改善其在瓶颈层编码能力的不足,并充分丰富了说话人的个性化特征,能够较好地提升转换后语音的个性相似度和语音质量,有效的提高现有VAE网络的语音转换性能。
  • 一种便携式语音信号分析装置-201821912348.8
  • 邵锦江;王璨 - 武汉大学
  • 2018-11-20 - 2019-07-23 - G10L25/18
  • 本实用新型提出一种便携式语音信号分析装置,包括:微处理器、拾音器输入模块、前置放大模块、带通滤波模块、电平抬升模块、模数转换模块、快速傅里叶变换模块、数模转换模块、存储模块、电流电压转换模块、低通滤波模块、功率放大模块、语音输出模块、按键控制模块、LED显示模块。与现有技术相比,本实用新型主要专注于语音信号的频谱分析,电路简单,易于实现;精度尚可,实用性强;便于携带,可实时分析语音信号,并有回放功能。
  • 一种音频信号处理方法及装置-201510632668.2
  • 李小明 - 宇龙计算机通信科技(深圳)有限公司
  • 2015-09-29 - 2019-06-11 - G10L25/18
  • 本发明实施例公开了一种音频信号处理方法及装置,包括:获取参考音频信号,其中,所述参考音频信号包括M个音源的M组音频信号,所述M为正整数;检测所述M是否大于或等于预设阈值;若检测到所述M大于或等于预设阈值,则对所述参考音频信号执行全频段动态范围控制FDRC操作以获取目标音频信号;输出所述目标音频信号。采用本发明实施例,有利于提升音频信号处理效率和音频播放的流畅性。
  • 一种对基频估计实验验证的方法-201811495768.5
  • 张维维 - 大连民族大学
  • 2016-01-22 - 2019-03-26 - G10L25/18
  • 本分案申请公开了一种对基频估计实验验证的方法,属于信号处理领域,为了解决验证的问题,技术要点包括:使用基频估计方法对一帧音乐信号进行基频估计,并仿真得到仿真图,验证的情形是:信号中基频分量的幅度大于二次谐波幅度,效果是实现了验证基频估计的效果。
  • 一种婴儿啼哭原因的预测方法及装置-201811592904.2
  • 鲍晓 - 科大讯飞股份有限公司
  • 2018-12-25 - 2019-03-22 - G10L25/18
  • 本申请公开了一种婴儿啼哭原因的预测方法及装置,该方法包括:首先,通过对目标婴儿的音频和视频进行同步录制,获取目标婴儿在啼哭时段内的原始音频数据与原始视频数据,并分别作为目标音频数据与目标视频数据,其中,原始视频数据包括目标婴儿的面部特写视频数据和/或行为动作视频数据,接着,可以根据获取到的目标音频数据与目标视频数据,预测出目标婴儿的啼哭原因。可见,本申请在预测目标婴儿的啼哭原因时,将目标婴儿在啼哭时段内的音频数据和视频数据相结合,能够更准确地预测出目标婴儿的啼哭原因。
  • 副歌检测方法及系统-201510810644.1
  • 李飞吾;杨溥;潘青华 - 科大讯飞股份有限公司
  • 2015-11-19 - 2019-03-19 - G10L25/18
  • 本发明公开了一种副歌检测方法及系统,该方法包括:接收待检测的音频数据;提取所述音频数据的检测特征,所述检测特征包括所述音频数据不同频段的频域能量包络的极值点的频率值及能量值;利用提取的检测特征进行副歌检测,得到检测结果。利用本发明,可以有效提高副歌检测的准确度。
  • 谐波信号基频估计算法及装置-201610044926.X
  • 张维维;李敏;许爽;董玉华 - 大连民族大学
  • 2016-01-22 - 2019-03-15 - G10L25/18
  • 一种谐波信号基频估计算法及装置,属于信号处理领域,为了解决快速、准确提取基频,并减少频谱泄露对高频谱峰的影响的问题,技术要点包括:S1.对音频信号作常Q变换,得常Q变换谱;S2.使用常Q变换谱计算得折叠谐波求和谱;S3.由折叠谐波求和谱的谱峰初步筛选基频;S4.建立基频候选的后验概率密度函数,根据最大后验概率准则提取并输出谐波信号基频。效果是:用常Q变换实现多分辨率谱估计,基于常Q变换谱定义折叠谐波求和谱,并将其用于初步基频筛选。通过最大后验概率法实现基频估计,其中先验概率由折叠谐波求和谱求出,似然函数由谐波谱峰与观测频谱的匹配度确定。
  • 一种基频估计算法在各类具有谐波结构的信号的基频估计中的应用-201811494641.1
  • 张维维 - 大连民族大学
  • 2016-01-22 - 2019-03-01 - G10L25/18
  • 本分案申请公开了一种基频估计算法在各类具有谐波结构的信号的基频估计中的应用,属于信号处理领域,为了解决快速、准确提取基频,并减少频谱泄露对高频谱峰的影响的问题,技术要点所述音频谐波信号基频估计算法,用常Q变换实现多分辨率谱估计,基于谐波求和能量定义折叠谐波求和谱,并将其用于初步基频筛选,通过最大后验概率法实现基频估计,效果是减少频谱泄露对高频谱峰的影响。
  • 能识别音乐自动成谱的方法-201510389632.6
  • 刘德文;茄振中;陈洪波;阮广璇 - 成都云创新科技有限公司
  • 2015-07-06 - 2019-02-12 - G10L25/18
  • 本发明公开了能识别音乐自动成谱的方法。包括步骤:(1)识别音频,追踪整体频谱的变化,实时检查是否有发音趋势;(2)追踪每个音高的频谱变化,实时检查哪些是音高发声;(3)继续追踪已发声音音高的频谱变化,检查之前的音高发声判断是否是误判;(4)根据以上步骤获得的发声音高数据、发声时间数据,估算曲谱的速度、调式以及音符类型,生成曲谱。本发明独创了一种可根据音高识别结果,逆向估算出原来曲谱的技术,最终完整实现自动识别音频音乐自动形成曲谱的方法,可满足运算简单、高效可信,在发音数上具有鲁棒性,兼容各种乐器的要求,运用于手机软件、可嵌入式设备中,还可应用于作曲创作自动成谱、乐器演奏练习检查等场景。
  • 一种音频处理方法和音频处理装置-201510671350.5
  • 任超 - OPPO广东移动通信有限公司
  • 2015-10-15 - 2019-02-12 - G10L25/18
  • 本发明实施例公开了一种音频处理方法和装置,所述方法包括:获取音频数据;对所述音频数据进行频谱分析,以得到频谱分析结果;据所述频谱分析结果调节所述音频数据的频率的增益,生成第一音效模式,并按照所述第一音效模式播放所述音频数据;根据操作终端的反馈信息确定音效模式。相对于现有技术,本发明的音频处理方法和装置获取音频数据后,对所述音频数据进行频谱分析,以得到频谱分析结果;从而据所述频谱分析结果调节所述音频数据的频率的增益,生成第一音效模式,并按照所述第一音效模式播放所述音频数据,使得音效的设置能自动实现,然后根据操作终端的反馈信息确定音效模式,音效模式由操作终端最后确定,从而使得音效的设置更加灵活。
  • 一种音频信号分析方法-201510464225.7
  • 刘娜;肖唐良;牛大胜;杨青;宫夏;王蒙;董守拯 - 中国电子科技集团公司第四十一研究所
  • 2015-07-23 - 2018-12-28 - G10L25/18
  • 本发明涉及一种音频信号分析方法,包括以下步骤:步骤一、第一次频率预判;步骤二、传输数据量调整方法;步骤三、第二次频率预判;步骤四、分析数据量调整。本发明通过动态调整传输数据量及分析数据量的方式,在进行低端音频信号处理时可以适当减少传输数据,不仅可以节约资源,还可以缩短信号传输时间,达到提高音频分析速度的目的;通过协调后级软件分析的方式,动态调整参与频域变换的数据量,又提高了全频段分析的精度。
  • 一种基于嵌入式微处理单位非特定对象语音识别方法-201810544740.X
  • 胡波 - 深圳市泰辰达信息技术有限公司
  • 2018-05-31 - 2018-11-23 - G10L25/18
  • 本发明公开了一种基于嵌入式微处理单位非特定对象语音识别方法,包括以下步骤:S1,音频获取:由录音单元进行录音,获得音频数据;S2,对获得的音频数据进行处理,得到不含静音和长时间停顿的目标语音数据;S3,首先对目标语音数据进行MFCC声学特征处理,得到特征码;然后通过预先加载的语言模型和音素字典,搜索出音素,根据获得的音素,使用向前概率算法组合出音节,然后计算出词组字符串;S4,通过模糊匹配算法,识别语言指令,本发明的有益效果是:支持语音指令可扩展,数量不受限,语音识别率高,应用领域广泛,在原有的硬件系统就可支持,无需增加额外的语音识别芯片。
  • 音频处理装置以及音频处理方法-201310540742.9
  • 光藤祐基;何亚瑟 - 索尼公司;声学及音乐调配研究院
  • 2013-11-05 - 2018-11-16 - G10L25/18
  • 本发明涉及音频处理装置和音频处理方法。一种音频处理装置,包括:分解单元,用于将通过对来自于多个通道的音频信号执行时间‑频率变换而获得的频率信息分解为表示通道方向的特征的通道矩阵、表示频率方向的特征的频率矩阵和表示时间方向的特征的时间矩阵;以及提取单元,用于基于所述通道矩阵、所述频率矩阵和所述时间矩阵提取来自于任意指定方向的音频的频率信息。
  • 一种语音信息验证方法-201810302824.2
  • 向湘杰 - 东莞市华睿电子科技有限公司
  • 2018-04-06 - 2018-09-21 - G10L25/18
  • 本发明提供了一种语音信息验证方法,通过接收客户端发出的待验证音频信号;对所述音频信号进行快速傅里叶变换得到频域信号;根据所述频域信号计算谱幅度值;计算所述谱幅度值的概率密度,根据所述概率密度计算所述音频信号的谱熵,以及根据所述谱熵确定所述音频信号是否为语音信号;若为语音信号则识别出所述语音信号中包含的语音信息;将所述语音信号中识别出的语音信息与预设的验证信息相比对,若相同,则通过验证,本发明中所采用的方法所针对的都是语音信号本身的属性,而不必进行语义分析这种需要涉及到人工智能和神经网络的计算方式,从而减少了计算量,提高了语音信息验证的效率。
  • 一种局部傅里叶变换的音频相似判断方法-201711345157.8
  • 王祝 - 奕响(大连)科技有限公司
  • 2017-12-15 - 2018-05-29 - G10L25/18
  • 本发明公开了一种局部傅里叶变换的音频相似判断方法。第一步,将音频平均切割成64段;第二步,将每个分割后的音频进行傅里叶频域变换,取频域最大的五个分割段,串接组成一个新的频谱;再进一步分割为32段;第三步,分别取频域谱和时域谱中,最大的值组成一个64位数列,先是32位频域值,后是32位时域值;第四步,分别求出32位频域值和32位时域值的均值;第五步,将每位频域值和32位时域与对应的均值做对比;大于或等于为1,小于为0;组成新的64位基于1、0的散列;第六步,比较两段音频的散列,得到位数不同的数量,小于或等于3,则音频相似。
  • 获取基音波形数据的方法和装置-201711337024.6
  • 肖纯智 - 广州酷狗计算机科技有限公司
  • 2017-12-12 - 2018-04-24 - G10L25/18
  • 本公开是关于一种获取基音波形数据的方法和装置,属于音频技术领域。所述方法包括对目标音频中每个音频帧进行音高提取,得到每个音频帧对应的目标频率;对于每个音频帧,基于所述音频帧对应的目标频率,在所述音频帧的频谱数据中,确定对应的目标振幅;基于每个音频帧对应的目标振幅和目标频率,确定所述目标音频的基音波形数据。采用本公开,根据音高与基音的振动频率成正比的关系,通过每一帧音频的音高确定每一帧音频中基音的平均频率,然后基于基音的平均频率得到每一帧音频的基音波形数据,最后得到目标音频的基音波形数据,进而,可以准确得到目标音频的基音振动情况。
  • 用于音频帧处理的设备和方法-201710951055.4
  • 菲利普·吉尔贝东;斯尔丹·基蒂奇 - 汤姆逊许可公司
  • 2017-10-12 - 2018-04-20 - G10L25/18
  • 一种用于计算用于音频信号识别的散射特征的设备(200)和方法。接口(240)接收通过处理器(210)处理(S610)的音频信号,以获得音频帧。处理器(210)根据至少一个音频帧计算(S620)一阶散射特征,然后针对一阶散射特征计算(S630)一阶散射特征是否包括用于精确的音频信号识别的足够信息的估计。仅在一阶散射特征不包括用于准确的音频信号识别的足够信息的情况下,处理器(240)根据一阶散射特征计算(S650)二阶散射特征。由于仅当认为必要时才计算二阶特征,所以该设备可以使用更少的处理能力,这能够导致设备使用的功率更少。
  • 音频相似度检测方法及装置-201510148926.X
  • 曾荣;朱映波;吴伟芬;时义朋;潘志峰 - 天翼爱音乐文化科技有限公司
  • 2015-03-31 - 2018-04-20 - G10L25/18
  • 本发明涉及一种音频相似度检测方法及装置。所述方法包括步骤获取待评价音频信号,根据所述待评价音频信号得到音频信号频谱;识别所述音频信号频谱的波峰位置;获取各所述波峰位置对应的特征值和时间点,根据各所述特征值和时间点得到待评价音频信号的第一时间序列;将所述第一时间序列与第二时间序列进行对比,根据对比结果得到待评价音频信号与参考音频信号的相似度,其中所述第二时间序列为预先获取的所述待评价音频信号对应的参考音频信号的时间序列。本发明能够对音频信号进行快速准确的评价,可以应用于多种应用场景。
  • 音效处理方法和系统、计算机存储介质及设备-201711035929.8
  • 汪慎 - 广州视源电子科技股份有限公司
  • 2017-10-30 - 2018-04-13 - G10L25/18
  • 本发明涉及一种音效处理方法和系统、计算机存储介质及设备,其中方法包括采集音频播放装置输出的音频信号;对所述音频信号进行频谱分析,获取频谱分布特征;根据所述频谱分布特征确定与所述音频信号匹配的音效模式,根据所述音效模式对所述音频信号进行音效处理。上述方案,对音频播放装置输出的音频信号进行采集和分析,根据分析结果确定音频信号匹配的音效模式,并根据此音效模式对音频信号进行音效处理,提高了音效处理的效果。
  • 一种声反馈检测方法和装置-201410817530.5
  • 黄妮 - 海能达通信股份有限公司
  • 2014-12-24 - 2018-03-16 - G10L25/18
  • 本发明公开了一种声反馈检测方法和装置,其中方法包括对接收到的时域信号进行时频变换得到频域信号;计算功率峰值左右相邻多个点的功率和值以及所述频率信号的平均功率值;根据所述功率和值以及所述平均功率值确定判决值;根据所述功率峰值频率落入的频段范围确定对应的预置的第一阈值,若所述判决值大于所述预置的第一阈值,确定所述判决值为所述频段范围对应的待统计判决值;统计在预置时间内所述频段范围对应的所述待统计判决值的个数,以及在预置时间内落入所述频段范围内的功率峰值重复时长;如果个数大于预置的第二阈值或重复时长大于预置的第三阈值,确定正在发生声反馈。如此技术方案,能够提高声反馈检测的准确性和可靠性。
  • 有利于节省时间的信号分析系统-201711017226.2
  • 张剑峰;冉晓林;黎宏国 - 成都优购科技有限公司
  • 2017-10-26 - 2018-02-27 - G10L25/18
  • 本发明公开了有利于节省时间的信号分析系统,包括用于对初始音频信号进行预处理的预处理模块;用于将预处理后的初始音频生成两个与预处理后的初始音频信号相同的音频信号的生成模块两个与预处理后的初始音频信号相同的音频信号包括第一音频信号和第二音频信号;用于将第一音频信号进行频率初选的初选模块。本发明有利于节省时间的信号分析系统,通过设置上述模块,将频率初选和提取特征分开同时进行,并通过加权的方式得到音频信号得到基频估算值,相比现有技术中要进行大规模傅里叶变换的方式大幅降低了运算量,有利于大规模推广。
  • 音乐分析方法及装置-201710865677.5
  • 蔡意明;朴飞 - 上海韵焰智能科技有限公司
  • 2017-09-22 - 2018-01-19 - G10L25/18
  • 本申请实施例提供了一种音乐分析方法及装置,所述方法包括对音频数据进行切分,获取多组音频数据;对多组音频数据中的每组音频数据进行快速傅里叶变换,获得频谱数据;对频谱数据分别进行峰值检测、节奏点检测、响度检测、能量分析以及音色分析,获得音频分析结果数据。本申请实施例通过对音乐文件的音频数据进行切分以及快速傅里叶变换,再对快速傅里叶变换获得的频谱数据进行峰值检测、节奏点检测、响度检测等获得音频分析结果,与现有的根据音乐自行调节灯光的方式相比,既能节约请专业灯光师所要花费的成本,又可以保证一定的专业性。
  • 基于仿生听觉系统中耳蜗模型的海豚哨声信号听觉特征提取方法-201710793362.4
  • 孙金涛;生雪莉;郭龙祥;殷敬伟 - 哈尔滨工程大学
  • 2017-09-06 - 2017-12-29 - G10L25/18
  • 本发明的目的在于提供基于仿生听觉系统中耳蜗模型的海豚哨声信号听觉特征提取方法,采用如下步骤(1)对信号进行归一化预处理;(2)将步骤1得到的信号通过Gammatone听觉滤波器组,得到M个子带信号;(3)对步骤2子带信号做快速傅里叶变换,通过低通滤波器,并生成听觉谱;(4)将步骤3子带信号通过Meddis内毛细胞模型,对子带听觉谱自适应处理,得到增强后的听觉谱,(5)计算听觉谱各个子带听觉谱能量,获得M维特征向量。本发明可以解决现有技术中,运算量大,无法快速提取特征;对非线性信号,非平稳信号处理效果不理想;对背景噪声的高依赖性,应用局限性的问题。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top