[发明专利]一种应用于变速率语音和音频编码的码率自动控制系统有效

专利信息
申请号: 201110459187.8 申请日: 2011-12-31
公开(公告)号: CN102543090A 公开(公告)日: 2012-07-04
发明(设计)人: 程荣;梁毅 申请(专利权)人: 深圳市茂碧信息科技有限公司
主分类号: G10L19/14 分类号: G10L19/14;G10L19/00
代理公司: 深圳鼎合诚知识产权代理有限公司 44281 代理人: 薛祥辉
地址: 518057 广东省深圳市南山区科技*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 应用于 速率 语音 音频 编码 自动控制系统
【说明书】:

技术领域

发明涉及语音和音频码率自动控制技术,更具体的涉及一种应用于移动互联网语音通信、移动流媒体服务器等的语音和音频编码的码率自动控制技术。

背景技术

语音和音频码率控制技术是指语音和音频信号在编码之前,根据信号的内容的重要性,自动调整编码的速率,在重要信息时采样相对高的码率进行编码,在次要信息(比如噪声)时候采样相对低的码率进行编码,使得在带宽下受限的条件下,既能有较好的语音质量,又能节省带宽。该技术一般用于分组域(PS)移动语音通信、移动流媒体服务器等应用中。

现有的分组域(PS)移动语音通信中的语音编码技术大多采用第三代移动通信系统中AMR(自适应多码率)语音编码技术,传统的电路域(CS)AMR语音编码的速率控制是由基站来控制的,由于AMR本身并没有提供码率控制功能,所以分组域(PS)的AMR编码实际多采用固定速率进行编码,这个在移动互联网有限的带宽条件下,在带宽和语音质量之间很难达到一个较好的平衡。其他的几种传统的变速率语音编码(如QCELP、EVRC和SMV等)一般只用于传统的电路域(CS)语音通信,且基本是采用语音活性检测(VAD,Voice Activity Detector)检测加信号能量判断的方法来进行速率控制,这类方法过多依赖于信号能量的大小,而实际上信号内容的重要性并不能完全反映在能量大小上。

发明内容

本发明解决的技术问题是提出一种应用于变速率语音和音频编码的码率自动控制系统,实现在带宽受限条件下的分组域移动语音通信中,根据要编码的信号内容的重要性来自动调整码率,提升语音和音频的质量。

本发明提出的应用于变速率语音和音频编码的码率自动控制系统,包括:变速率编码器、自适应码率控制单元;输入的语音或音频PCM信号分别输入所述变速率编码器和所述自适应码率控制单元的信号输入端,所述自适应码率控制单元通过计算所述PCM信号的子带信噪比得到编码速率调整参数,并将所述调整参数输出到所述变速率编码器的变速率编码控制端完成对所述PCM信号的变速率编码。

进一步的,所述自适应码率控制单元包括:频域变换模块、子带处理模块、子带信噪比计算模块、以及码率输出模块;所述PCM信号经过所述频域变换模块进行频域变换,并由所述子带处理模块进行子带划分、子带信号能量计算以及子带噪声能量计算,然后经过子带信噪比计算模块进行子带信噪比计算,并由所述码率输出模块通过与历史帧的子带时域平均信噪比的比较得到编码速率调整参数。

进一步的,所述子带处理模块包括:子带信号处理模块和子带噪声处理模块;所述子带信号处理模块与所述频域变换模块相连,对所述频域变换后的信号进行子带划分和子带信号能量计算,然后由所述子带噪声处理模块完成子带噪声能量计算。

进一步的,在所述子带信号处理模块和子带噪声处理模块之间还包括判断输入信号是否为噪声信号的语音活性检测模块。

本发明通过计算信号子带信噪比来自动调节编码码率,压缩后的码流与现有技术大小相当的固定码率压缩后的码流相比,采用本发明解压后的信噪比有明显的提升。在一个实验中,将相同的一端语音信号分别采用固定码率(AMR7.95kbps)进行编码和采用本发明的码率自动控制系统进行辅助编码的比较分析,对解码后得到的两个信号的信噪比曲线进行对比,两种方式压缩后的码流大小相当,但是采用本发明时,解压后信噪比有明显提升,最大有13dB的信噪比提升。在另一个实验中,将相同的一段音乐信号采用固定码率(AMR 7.95kbps)进行编码和采用本发明的码率自动控制系统进行辅助编码的比较分析,对解码后得到的两个信号的信噪比曲线进行对比,两种方式压缩后的码流大小相当,但是采用本发明时,主旋律信号信噪比有明显提升,最大有10dB的信噪比提升。

附图说明

图1为本发明实施例一的码率自动控制系统原理图;

图2为本发明实施例二的自适应码率控制单元结构示意图;

图3为本发明实施例二中的子带处理模块的结构示意图。

具体实施方式

下面结合附图,并通过具体实施例对本发明的具体实现进行说明。

本发明的主要发明构思是通过计算信号子带信噪比来自动调节编码码率的。首先通过对输入的语音或音频PCM信号进行预处理和频域变换,得到频域信号后,划分子带并计算子带信噪比,然后进行背景噪声检测来区分输入信号是否为噪声,如果为噪声则进行背景噪声能力更新,最后计算子带信噪比并根据信噪比自适应计算最优码率,最优码率值输出给变速率编码器进行语音或者音频信号编码。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市茂碧信息科技有限公司,未经深圳市茂碧信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110459187.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top