[发明专利]音频编码中的后量化增益校正有效
申请号: | 201510671694.6 | 申请日: | 2011-07-04 |
公开(公告)号: | CN105225669B | 公开(公告)日: | 2018-12-21 |
发明(设计)人: | 艾力克·诺维尔;沃洛佳·格兰恰诺夫 | 申请(专利权)人: | 瑞典爱立信有限公司 |
主分类号: | G10L19/032 | 分类号: | G10L19/032;G10L19/083 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 余婧娜 |
地址: | 瑞典斯*** | 国省代码: | 瑞典;SE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种用于在对已经以相对独立的增益表示和形状表示来编码的音频进行解码中使用的增益调整装置(60),包括:精度仪(62),被配置为估计所述形状表示的精度测度(A(b)),并且基于所估计的精度测度(A(b))来确定增益校正(gc(b))。其还包括:包络调整器(64),被配置为基于所确定的增益校正来调整所述增益表示 | ||
搜索关键词: | 音频 编码 中的 量化 增益 校正 | ||
【主权项】:
1.一种在对音频进行解码时使用的增益调整方法,所述音频已经以相对独立的增益表示和形状表示进行了编码,所述方法包括步骤:估计(S1)所述形状表示的精度测度(A(b)),其中所述形状表示已经使用脉冲矢量编码方案进行编码,并且所述精度测度(A(b))是基于脉冲数目(R(b))和最大脉冲高度(pmax(b))得到的;基于所估计的精度测度(A(b))来确定(S2)增益校正(gc(b));基于所确定的增益校正来调整(S3)所述增益表示
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瑞典爱立信有限公司,未经瑞典爱立信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510671694.6/,转载请声明来源钻瓜专利网。
- 同类专利
- 语音声源方向估计方法及装置-201610656669.5
- 谢宜昊 - 珠海全志科技股份有限公司
- 2016-08-11 - 2019-09-06 - G10L19/032
- 本发明提供一种语音声源方向估计方法及装置,该方法包括:声源获取步骤,获取麦克风阵列实时收集的音频数据;频带分解步骤,将每一个麦克风通道所收集的当前帧音频数据分解成预设数量的频带信号,将所有麦克风通道同一时刻的频带信号组成频带信号向量;频带估计步骤,对频带信号向量进行分析,获得当前帧音频数据相同时刻的频带信号向量的波达方向估计向量;数据关联步骤,根据波达方向估计向量进行数据关联,得到当前帧音频数据的最终备选方向估计向量;波达方向跟踪步骤,对最终备选方向估计向量在时域中进行平滑处理,并获得当前帧音频数据的语音声源波达方向。该装置为该方法提供应用模块。本发明可增强语音,且语音方向估计更加精确。
- 基于单比特压缩感知的语音压缩方法-201510504880.0
- 卿朝进;陈永强;张岷涛;胡书东;余杭薄;李成军 - 西华大学
- 2015-08-17 - 2019-06-14 - G10L19/032
- 本发明属于语言信号压缩领域,具体涉及一种基于单比特压缩感知的语音压缩方法。本发明的有益效果如下:1、语音信号的采样速率要求并不高,用于语音采样的AD并不是语音信号采样的瓶颈问题。其他需要利用压缩感知进行采样以降低AD采样速率的场景为高速采样场景,语音信号采样不属于高速采样,故可以不改变系统原有的采样器件与采样结构,只需要进行软件的修改,大大节约了系统改造的成本;2、目前流行的mp3技术,仅能压缩10余倍,而利用本发明的方法,可轻易地将语音压缩32倍以上,其音质也能达到近似于mp3标准音质。譬如电信领域的录音系统,需要存储海量的语音数据,如果利用本发明的压缩方法将会十分有利。
- 音频编码中的后量化增益校正-201510671694.6
- 艾力克·诺维尔;沃洛佳·格兰恰诺夫 - 瑞典爱立信有限公司
- 2011-07-04 - 2018-12-21 - G10L19/032
- 一种用于在对已经以相对独立的增益表示和形状表示来编码的音频进行解码中使用的增益调整装置(60),包括:精度仪(62),被配置为估计所述形状表示的精度测度(A(b)),并且基于所估计的精度测度(A(b))来确定增益校正(gc(b))。其还包括:包络调整器(64),被配置为基于所确定的增益校正来调整所述增益表示
- 带宽扩展编码和解码方法以及装置-201510591602.3
- 闫建新;王磊 - 深圳广晟信源技术有限公司
- 2015-09-16 - 2018-11-23 - G10L19/032
- 本发明涉及一种带宽扩展编码和解码方法以及装置,组合了自适应多分辨率滤波和自适应时频栅格构造以及复数线性预测编码高频细节生成两个关键技术,可明显提高数字音频信号的高频部分编码效率和高频部分信号的声音质量,而数字音频信号的低频部分仍可采用传统的感觉音频编码(如DRA),从而实现了一种在低码率和中等码率下均具有较高主观声音质量的编码技术。另一方面,本发明是在当前DRA等高质量感觉编码算法基础上添加的增强工具,这样也可保证与传统的感觉编码DRA等算法向下兼容。基于本发明所实现的数字音频编解码器可用于卫星HDTV的伴音处理及高质量音频广播等领域。
- 用于通过使用频谱模式有效合成正弦曲线和扫描的设备及方法-201380064128.8
- 萨沙·迪施;本亚明·舒伯特;拉尔夫·热日尔;贝恩德·埃德勒;马丁·迪策尔 - 弗劳恩霍夫应用研究促进协会
- 2013-09-20 - 2018-11-16 - G10L19/032
- 提供了一种基于编码音频信号频谱生成音频输出信号的设备。该设备包括处理单元(115),其用于对编码音频信号频谱进行处理,以获得包括多个频谱系数的解码音频信号频谱,其中,每个频谱系数具有频谱值和在编码音频信号频谱内的频谱位置,其中,频谱系数根据其在编码音频信号频谱内的频谱位置被依次排序,使得频谱系数形成频谱系数序列。此外,该设备包括伪系数确定器(125),其用于确定解码音频信号频谱的一个或更多个伪系数,每个伪系数具有频谱值。此外,该设备包括替换单元(135),其用于用确定的频谱模式替换至少一个或更多个伪系数,以获得修改的音频信号频谱,其中,确定的频谱模式包括至少两个模式系数,其中,该至少两个模式系数中的每一个具有频谱值。此外,该设备包括频谱时间转换单元(145),其用于将修改的音频信号频谱转换至时域,以获得音频输出信号。
- 一种基于压缩感知的音频信号采样和重建方法-201810210109.6
- 贾晓立;戴俊宇;应忍冬;刘佩林 - 上海交通大学
- 2018-03-14 - 2018-10-12 - G10L19/032
- 本发明提出了一种基于压缩感知的音频信号采样和重建方法。该方法将音频信号MDCT系数的概率分布用伯努利‑高斯模型来表示;将系数的时频连续性用马尔可夫随机场来建模。MDCT系数通过非自适应线性投影获得远低于传统采样定理所需数据量的测量值。信号重建以Turbo消息传递框架迭代完成。首先利用近似消息传递(AMP)算法从各帧测量值得到原始系数估值,再将估值信息传递给信号的马尔可夫随机场模型并进行置信传播,两者交替执行直至相邻迭代中的系数估值之差低于阈值。该方案利用了AMP算法的高效性,挖掘了音频信号频域结构信息,频域采样的同时进行了数据压缩,重建信号具有较高的信噪比。
- 基于深度神经网络的音频带宽扩展编码解码方法及装置-201510549716.1
- 胡瑞敏;姜林;胡霞;王晓晨;张茂胜;涂卫平;李登实 - 武汉大学
- 2015-08-31 - 2018-08-21 - G10L19/032
- 本发明公开了一种基于深度神经网络的音频带宽扩展编码解码方法,装置包括编码单元与解码单元。编码单元包络预处理模块、高频参数提取模块、低频编码模块、码流生成模块;解码单元包括码流输入模块、高频参数解码模块、低频信号解码模块、自编码器参数预测模块、深度神经网络精细结构预测模块、高频信号重构模块、信号合成模块。本发明首先利用信号低频部分与高频部分存在的自相关性,使用深度神经网络预测的方法,预测高频部分的精细结构。再将精细结构与编码端得到高频部分的边信息相结合,重构出信号的高频部分。最后将信号高频部分与低频部分融合,得到最终的恢复信号。本发明相比传统方法在码率上大幅降低,且音质与传统方法相当。
- 一种音频信号转视觉颜色信息的方法及系统-201410833247.1
- 徐永键;陆许明;刘志敏;谭洪舟 - 中山大学花都产业科技研究院;中山大学
- 2014-12-29 - 2018-04-06 - G10L19/032
- 本发明提供一种音频信号转视觉颜色信息的方法及系统,方法包括S1对音频信号进行采样;S2计算音频信号的亮度V;S3计算音频信号的色相H和饱和度S;S4将亮度V、色相H和饱和度S进行RGB颜色格式转换;S5将S4中得到的RGB值进行颜色混合最终提取音频信号的颜色值。本发明通过将采集的音频信号量化处理,计算出其能量值来代表亮度,通过FFT处理来计算其代表的色相和饱和度,再将得到的亮度、色相和饱和度转换成RGB颜色格式,整个方法都是依据科学原理计算推演,过程都是一个的量化处理过程,没有人的主观意思的表达,科学严谨。
- 一种ISF系数矢量量化的方法与装置-201410524836.1
- 胡瑞敏;张茂胜;姚雪春;王晓晨;姜林;涂卫平;王松;杨乘 - 武汉大学深圳研究院
- 2014-09-30 - 2017-11-24 - G10L19/032
- 本发明涉及一种ISF系数矢量量化方法与装置,将训练好的多区域码表中的ISF系数转化为LPC系数,分别获取区域索引Choosen_cluster(i)、第一级矢量量化VQ的索引VQ(j)和第二级分裂矢量量化SVQ的索引SVQ[5]对待量化的ISF[16]系数进行量化,得到量化后的ISF_q[16],进一步得到当前帧量化后的LPC_q[16],将原始的LPC[16]系数通过功率谱计算公式得到对应的功率谱pf[128];将得到的当前帧量化后的LPC_q[16]系数和原始LPC[16]系数对应的功率谱pf[128]计算出当前区域对应的谱失真SD,并与上一个区域的谱失真进行比较,获取最小的谱失真SD,将最小谱失真对应的区域索引Choosen_cluster(i)和第一级矢量量化后的索引VQ(j)以及第二级分裂矢量量化后的索引SVQ[5]输出,完成ISF系数矢量量化。本发明仅使用42bit量化16阶ISF系数,相比AMR‑WB+的46bit,少了4bit。
- 使用改进的概率分布估计的基于线性预测的音频编码-201380043524.2
- 汤姆·贝克斯特伦;克里斯蒂安·黑尔姆里希;纪尧姆·富克斯;马库斯·穆尔特鲁斯;马丁·迪策尔 - 弗劳恩霍夫应用研究促进协会
- 2013-06-19 - 2017-09-15 - G10L19/032
- 通过使用概率分布估计对由多个频谱分量构成的频谱进行编码来改进基于线性预测的音频编码,该概率分布估计是针对该多个频谱分量中的每个频谱分量根据线性预测系数信息来确定。具体地,总能获得该线性预测系数信息。因此,该信息可用于在编码侧和解码侧确定概率分布估计。该概率分布估计的确定可通过使用例如在该多个频谱分量处对概率分布估计的适当参数化以计算上简单的方式来实施。总之,由熵编码提供的编码效率与使用环境选择达到的概率分布估计兼容,但概率分布估计的求导较不复杂。例如,该求导可单纯地以分析方式进行和/或不需要关于邻近频谱线的属性的任何信息,诸如在空间环境选择的情况下的邻近频谱线的先前被编码/解码的频谱值。
- 用于以带选择的方式量化语音信号的方法和设备-201280062478.6
- 郑奎赫;李英汉;洪起烽;田惠晶;李寅诚;姜仁圭;金洛榕 - LG电子株式会社;忠北大学校产学协力团
- 2012-05-04 - 2017-03-01 - G10L19/032
- 本发明涉及用于以带选择的方式量化语音信号的方法和设备。语音解码方法可以包括逆量化从选择性地量化的语音带产生的语音参数信息,和基于逆量化的语音参数信息执行逆变换。因此,根据本发明,在语音编码/解码中的编码/解码效率可以通过选择性地编码/解码重要信息而提高。
- 用于利用自适应低频补偿编码音频数据的方法和系统-201280066477.9
- A·比斯沃斯;V·迈勒扣特;米歇尔·舒格;格兰特·A.·戴维森;M·S·文顿 - 杜比实验室特许公司;杜比国际公司
- 2012-09-25 - 2016-11-30 - G10L19/032
- 一种用于确定要被编码的频域音频数据的音频数据值的尾数比特分配的方法。该分配方法包括确定用于音频数据值的掩蔽值的步骤,包括通过对音频数据的低频频带的集合的每个频带的音频数据执行自适应低频补偿。自适应低频补偿包括步骤:对音频数据执行音调检测以生成指示低频频带集合中的每个频带是否具有显著音调内容的补偿控制数据;以及对由补偿控制数据指示的具有显著音调内容的低频频带集合中的每个频带中的音频数据执行低频补偿,而不对在低频频带集合中的任何其它频带中的音频数据执行低频补偿。
- 显示音频频谱的装置及方法-201610488417.6
- 马子平 - 努比亚技术有限公司
- 2016-06-29 - 2016-11-16 - G10L19/032
- 本发明公开了一种显示音频频谱的装置及方法,其中,该装置包括:获取模块,用于按照预定时间间隔获取已录制的录音数据;确定模块,用于根据录音数据的输入比特率确定录音数据的幅值范围;确定多个预定采样时刻对应的幅值,以得到新的录音曲线;处理模块,用于通过三角函数对新的录音曲线进行平滑处理,以得到音频频谱;显示模块,用于将音频频谱显示在屏幕上。本发明对原始录音数据进行了二次采样,并对采样后的幅值曲线进行了平滑处理,处理后的音频频谱显示清晰,不会存在现有技术的音频频谱超出显示区域最大值的情况,利用三角函数对录音曲线进行处理后,使得到的音频频谱看起来更加直观和舒适,提高用户的视觉感受,解决了现有技术的问题。
- 一种音频编码带宽扩展中子带划分的量化方法及装置-201410524838.0
- 胡瑞敏;张茂胜;姚雪春;王晓晨;姜林;涂卫平;王松;杨乘 - 武汉大学深圳研究院
- 2014-09-30 - 2015-01-14 - G10L19/032
- 本发明涉及一种音频编码带宽扩展中子带划分的量化方法及装置,本发明对训练样本高频信号依次进行四次分割,每次分割时按照两个新子带的样点标准差乘积最小值获取样点分割点,最终获取16个样点分割点,以此16个样点分割点对输入的音频编码带宽进行扩展,可以获得更好的高频频谱结构,更接近高频频谱形状,从而提高高频频谱重建质量;本发明使用的子带划分方法充分考虑子带量化中的统计特性,相比巴克带或均匀划分方式,本发明的主观听力MOS分略有提升,信噪比有明显提升。
- 能量无损编码方法和设备、音频编码方法和设备、能量无损解码方法和设备、以及音频解码方法和设备-201280063986.6
- 朱基岘;吴殷美 - 三星电子株式会社
- 2012-10-22 - 2014-09-03 - G10L19/032
- 提供了一种无损编码方法,该无损编码方法包括:将量化系数的无损编码模式确定为无限范围无损编码模式和有限范围无损编码模式之一;在与无损编码模式确定的结果相对应的无限范围无损编码模式下对量化系数进行编码;在与无损编码模式确定的结果相对应的有限范围无损编码模式下对量化系数进行编码。
- 语音信号编码方法、语音信号解码方法及使用其的装置-201280057514.X
- 李英汉;郑奎赫;姜仁圭;田惠晶;金洛榕 - LG电子株式会社
- 2012-09-28 - 2014-07-23 - G10L19/032
- 本发明涉及一种用于处理语音信号的方法和装置,并且根据本发明的语音信号编码方法包括以下步骤:通过变换正弦波分量生成形成输入语音信号的正弦波分量的变换系数;根据所生成的变换系数确定将要编码的变换系数;以及发送指示所确定的变换系数的指示信息,其中,指示信息可以包括变换系数的位置信息、量级信息和符号信息。
- 用于对音频信号的时间段进行编码和解码的变换音频编解码器和方法-201180072006.4
- 沃洛佳·格兰恰诺夫;西德格尔·思维里森 - 瑞典爱立信有限公司
- 2011-06-30 - 2014-03-05 - G10L19/032
- 用于对音频信号的时间段进行有效编码/解码的方法和设备。该方法包括:导出与音频信号的时间段相关联的残差向量在频率刻度中的位置的指示符z,以及导出与残差向量的结构量有关的度量Φ。该方法还包括:确定是否满足涉及度量Φ、指示符z和预定义阈值Θ的预定义标准,这对应于估计在重构音频信号的时间段之后残差向量的非零系数中的至少一些非零系数的符号改变是否将是可听的。对残差向量的系数的相应幅度进行编码,并且仅当确定满足标准因而符号改变将是可听的时,才对残差向量的系数的符号进行编码。
- 基于时域混叠消除的无线音频压缩、解压缩方法及其设备-201310117937.2
- 杨洋;姚嘉;任金平;高永泽 - 杭州微纳科技有限公司
- 2013-04-07 - 2014-01-01 - G10L19/032
- 基于时域混叠消除的无线音频压缩、解压缩方法,包括:音频压缩和音频解压,前者包括对输入的音频PCM数据加窗滤波、MDCT变换、量化因子计算、声学掩蔽曲线计算、比特分配、量化计算、生成比特流;后者包括解析码流、解析量化因子、升学掩蔽曲线计算、比特分配、反量化、IMDCT、凯塞窗滤波、时域混叠。还包括执行上述方法的音频编码器和音频解码器。
- 一种声音编解码装置及其方法-201210085183.2
- 潘兴德;吴超刚;李靓 - 北京天籁传音数字技术有限公司
- 2012-03-28 - 2013-10-23 - G10L19/032
- 本发明涉及一种声音编解码装置及其方法,尤其涉及单声道声音编解码装置及其方法以及立体声声音的编解码装置及其方法。本发明通过将数字声音信号从时域映射到MDCT域,并将MDCT域上的低频谱和高频谱转换到MDFT域,结合针对MDCT域上的低频谱进行波形编码以及针对MDFT域上的低频谱和高频谱进行参数编码,最后将波形编码和参数编码的数据复用输出声音编码码流,降低了计算复杂度,在较低的码率下进一步提升了对音乐信号的编码质量。
- 一种声音编解码装置及其方法-201210085257.2
- 潘兴德;李靓;吴超刚 - 北京天籁传音数字技术有限公司
- 2012-03-28 - 2013-10-23 - G10L19/032
- 本发明涉及一种声音编解码装置及其方法。本发明通过将数字声音信号从时域映射到MDCT域,将MDCT域上的低、高频谱转换到MDFT域,对MDCT域上的低频谱进行波形编码,对MDFT域上的低、高频谱进行参数编码,其中,将低频谱的特定频段映射到高频谱的特定频段,在编码端对频谱映射前后的高频谱进行MDFT域边界预处理、在解码端对频谱映射后的高频谱进行MDFT边界预处理,并对参数解码后的高频谱进行MDFT域边界后处理,改善了因高频参数编码中的频带划分、低频谱至高频谱映射带来的问题,提高了频谱连续性和频带信号自然度、消除了谐波干涉噪声和因旁瓣泄露引起的混叠噪声,在较低的码率下进一步提高了高频参数编码的编码质量。
- 确定用于线性预测编码(LPC)系数量化的具有低复杂度的加权函数的设备和方法-201180061021.9
- 成昊相;吴殷美 - 三星电子株式会社
- 2011-10-18 - 2013-08-21 - G10L19/032
- 提出一种用于确定用于对线性预测编码(LPC)系数进行量化并具有低复杂度的加权函数的方法和设备。加权函数确定设备可将输入信号的中间子帧的LPC系数转换为导抗谱频率(ISF)系数和线谱频率(LSF)系数之一,并可基于转换后的ISF系数或LSF系数确定与ISF系数或LSF系数的重要性相关联的加权函数。
- 一种语音数据的编码及解码方法-201310176701.6
- 陶建华;刘斌;莫福源 - 中国科学院自动化研究所
- 2013-05-14 - 2013-08-14 - G10L19/032
- 本发明提供了一种语音数据的编码方法和解码方法。该编码方法包括:获取原始音频,通过端点检测剔除原始音频中的非语音数据,获得语音段数据;对每帧语音数据提取谱参数、基音周期等参数,并计算连续多帧语音数据的增益均值,通过矢量码本对谱参数进行矢量量化,对基音周期和增益均值进行非线性量化;对量化后的各种语音参数进行编码,生成语音数据包。该解码方法包括:对接收到的语音数据包进行解码,提取谱参数、基音周期、增益均值等参数,通过上述参数对激励参数和能量变化轨迹进行预测,最后通过声码器合成语音。本发明可以在极低编码速率的情况下,保持较高的语音音质。
- 音频编码装置-201210326726.5
- 真野龙二 - 瑞萨电子株式会社
- 2012-09-06 - 2013-04-10 - G10L19/032
- 本发明涉及音频编码装置。一种能够有效进行编码处理的音频编码装置包括:存储单元,存储音频数据;数据获取控制器,从存储单元获取音频数据;变换单元,处理从数据获取单元输出的音频数据信号以用于频率变换;和谐泛音产生/合成单元,基于在变换单元的输出波之中的第一输出波来产生谐波,并且合成谐波和在变换单元的输出波之中的第二输出波,第二输出波在频率方面比第一输出波高;以及编码器,使来自和谐泛音产生/合成单元的输出经受编码处理。
- 编码方法、解码方法、编码装置、解码装置、程序及记录介质-201180031632.9
- 福井胜宏;佐佐木茂明;日和崎佑介;小山翔一;堤公孝 - 日本电信电话株式会社
- 2011-07-04 - 2013-03-06 - G10L19/032
- 将多个样本进行矢量量化,求得矢量量化索引和量化值,从被分配用于与矢量量化索引对应的码的比特数减去与矢量量化索引对应的码所使用的比特数,将得到的数以下的比特数按照基于听觉特性的规定的优先顺序分配给分别由多个样本位置构成且被赋予了基于听觉特性的优先顺序的多个样本位置集合中的1个以上的样本位置集合,对于被分配了比特数的样本位置集合的每个,输出表示使属于该样本位置集合的样本的值、与将属于该样本位置集合的样本的量化值和与每个样本的位置对应的系数相乘的值之间的误差的有关属于该样本位置集合的全部样本位置之和最小的系数的组的索引信息。
- 一种在解码端细化窄带声码器参数的方法-201210423131.1
- 李晔;马晓凤;樊燕红;姜竞赛;郝秋赟 - 山东省计算中心
- 2012-10-30 - 2013-01-30 - G10L19/032
- 本发明公开了一种在解码端细化窄带声码器参数的方法,基于激励参数与声道参数间的相关性,在解码端对各参数进行更加精细的重构,提高其量化精度,进一步提高合成语音的质量。更具体地,对基于混合激励线性预测模型的窄带低速率语音编码中的编解码参数采用了基于不同参数间映射细化的方法。原有的技术对各编解码参数采用独立矢量量化。本发明考虑到了激励参数和声道参数之间的相关性,采用非线性映射的方法,对反量化的各编解码参数进行细化,因此提高了各参数的量化效率,改善了合成语音的质量。本方法可以提高合成语音的自然度。
- 专利分类