[发明专利]音调周期搜索范围设置装置和音调周期搜索装置有效

专利信息
申请号: 200510064104.X 申请日: 2002-08-01
公开(公告)号: CN1664928A 公开(公告)日: 2005-09-07
发明(设计)人: 佐藤薰;安永和敏;森井利幸 申请(专利权)人: 松下电器产业株式会社
主分类号: G10L19/12 分类号: G10L19/12;G10L11/04
代理公司: 北京市柳沈律师事务所 代理人: 邸万奎;黄小临
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要: 自适应声源向量发生器(ASSVG)103设置以在先前子帧中选择的整数精确度音调周期T0为中心的在前的和随后的音调周期为搜索小数精确度音调频率的范围,从自适应代码本(ACB)102中提取具有在这一范围内的小数精确度音调周期T-frac的自适应声源向量P(T-frac)。上一子帧整数音调周期存储器(LSFIPCS)108存储由失真比较器(DC)107选择的最佳音调周期的整数分量T0,并且在搜索下一子帧的音调周期时,向自适应声源向量发生器(ASSVG)103输出该最佳音调周期整数分量T0。最佳音调周期精确度判断部件(OPCAJS)109判断最佳音调周期为整数精确度还是小数精确度。比较判断部件(CJS)110限制作为最佳音调周期的小数精确度音调信息的选择次数。
搜索关键词: 音调 周期 搜索 范围 设置 装置
【主权项】:
1、一种音调周期搜索装置,包括:音调周期指示部件,以整数精确度给自适应声源向量发生部件依次指示预设音调周期搜索范围内的音调周期候选者;自适应声源向量发生部件,用于从自适应代码本中,提取具有由所述音调周期指示部件指示的整数精确度音调周期的自适应声源向量,并将所提取的自适应声源向量输出;整数精确度音调周期搜索部件,用于使用从所述自适应声源向量发生部件接收的自适应声源向量,进行对整数精确度音调周期的搜索,并输出整数精确度最佳音调周期索引和选择标准;小数音调周期自适应声源向量发生部件,用于补充从所述自适应声源向量发生部件接收的整数精确度自适应声源向量,并产生具有小数精确度音调周期的自适应声源向量,输出所产生的具有小数精确度音调周期的自适应声源向量;小数精确度音调周期搜索部件,用于使用从所述小数音调周期自适应声源向量发生部件接收的具有小数精确度音调周期的自适应声源向量,进行对小数精确度音调周期的搜索,并输出小数精确度最佳音调周期索引和选择标准;失真比较部件,其具有如下功能,比较从所述整数精确度音调周期搜索部件接收的选择标准和从所述小数精确度音调周期搜索部件接收的选择标准,将具有较大选择标准的索引作为指示正在处理的子帧部分的最佳音调周期的索引输出,并具有输出具有较大选择标准的音调周期的整数分量的功能;以及上一子帧整数音调周期存储部件,用于存储所述失真比较部件最后选择的音调周期的整数分量,并且在搜索下一子帧的音调周期时,向所述自适应声源向量发生部件输出该最后的音调周期整数分量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200510064104.X/,转载请声明来源钻瓜专利网。

同类专利
  • 在CELP编解码器中在子帧之间分派比特预算的方法和设备-201880061436.8
  • V.埃克斯勒 - 沃伊斯亚吉公司
  • 2018-09-20 - 2023-10-13 - G10L19/12
  • 一种将比特预算分派给(a)用于编码声音信号的编码器或(b)用于解码声音信号的解码器的CELP核心模块的多个第一部分和第二部分的方法和设备。在包括子帧的声音信号的帧中,向第一CELP核心模块部分分派相应比特预算,以及向第二CELP核心模块部分分派在向第一CELP核心模块部分分派它们的相应比特预算之后剩余的比特预算。根据可选方案,在帧的子帧之间分配第二CELP核心模块部分比特预算,并且向帧的至少一个子帧分派更大的比特预算。该至少一个子帧可以是帧的第一个子帧、第一个子帧之后的至少一个子帧、或者使用声门脉冲形状码本的子帧。
  • 声音编解码方法以及相关装置、系统-202210908196.9
  • 许剑峰 - 荣耀终端有限公司
  • 2022-07-29 - 2023-09-29 - G10L19/12
  • 本申请实施例提供了声音编解码方法以及相关装置、系统,改进了CELP编解码关于第一子帧中代数码本增益的计算过程。首先,可根据当前帧的分类参数CT的索引CTindex查表获得线性域中代数码本增益的线性估计值。之后,利用线性域中来自代数码本的代数码本矢量的能量(表示为#imgabs0#)去除线性域中代数码本增益的线性估计值,得到第一子帧中代数码本的估计增益#imgabs1#这样,在编解码计算第一子帧的代数码本的估计增益时,可以完全避免对数log运算和以10为底的指数运算这类复杂度高的运算,显著降低算法复杂度。
  • 用于在CELP编解码器中高效地分配比特预算的方法和设备-201880061368.5
  • V.埃克斯勒 - 沃伊斯亚吉公司
  • 2018-09-20 - 2023-08-22 - G10L19/12
  • 一种将比特预算分派给(a)用于编码声音信号的编码器或(b)用于解码声音信号的解码器的CELP核心模块的多个第一部分的方法和设备。在该方法和设备中,比特预算分派表为多个中间比特率中的每一个指派相应比特预算给第一CELP核心模块部分。确定CELP核心模块比特率,并且基于所确定的CELP核心模块比特率选择中间比特率中的一个。向第一CELP核心模块部分分派由比特预算分派表为选择的中间比特率指派的相应比特预算。
  • 短时语音信噪比估算方法、装置、设备及存储介质-202010657049.X
  • 叶志坚;李稀敏;肖龙源;刘晓葳 - 厦门快商通科技股份有限公司
  • 2020-07-09 - 2023-01-03 - G10L19/12
  • 本发明提供了一种短时语音信噪比估算方法、装置、设备及存储介质,方法包括对原语音进行线性预测编码处理,得到生成语音;将生成语音作为维纳滤波器参考源,得到语音样本;计算语音样本的信噪比,并对比前一次迭代得到信噪比差值,若信噪比差值的增量小于预设阈值时,得到最终信噪比;若信噪比差值的增量大于所述预设阈值时,遍历所述对原语音进行线性预测编码处理的步骤。上述一种短时语音信噪比估算方法,通过线性预测编码生成一段语音,作为维纳滤波器的参考源,维纳滤波器可以在有语音参考源的情况,快速和准确的生成语音样本,通过维纳滤波器估计成语音样本,在从带噪语音中减去语音样本得到噪声样本,实现快速计算出信噪比。
  • 解码方法、解码装置、和计算机可读取的记录介质-201810026834.8
  • 日和崎佑介;守谷健弘;原田登;镰本优;福井胜宏 - 日本电信电话株式会社
  • 2013-08-28 - 2021-12-07 - G10L19/125
  • 其目的在于,提供在基于以CELP类的方式为首的声音的生成模型的声音编码方式中,即使输入信号为噪声重叠声音也能够实现自然的再现音的解码方法。包含:声音解码步骤,从所输入的码得到解码声音信号;噪声生成步骤,生成作为随机的信号的噪声信号;以及噪声附加步骤,将噪声附加处理后信号设为输出信号,其中,所述噪声附加处理后信号是将对噪声信号进行基于与过去的帧的解码声音信号对应的功率和与当前的帧的解码声音信号对应的谱包络中的至少其中一个的信号处理而得到的信号、以及解码声音信号进行相加而得到的。
  • 在声音信号编码器和解码器中使用的方法、设备和存储器-201480077951.7
  • R.萨拉米;V.埃克斯勒 - 声代EVS有限公司
  • 2014-07-25 - 2021-05-04 - G10L19/12
  • 方法、编码器和解码器被配置用于具有不同内部采样速率的各帧之间的过渡。线性预测(LP)滤波器参数从采样速率S1转换为采样速率S2。使用LP滤波器参数在采样速率S1计算LP合成滤波器的功率谱。修改所述LP合成滤波器的功率谱,以将其从所述采样速率S1转换为所述采样速率S2。逆变换所述LP合成滤波器的修改后的功率谱,以确定在所述采样速率S2的所述LP合成滤波器的自相关。在所述采样速率S2使用所述自相关以计算所述LP滤波器参数。
  • 一种语音频信号处理方法和装置-201610263621.8
  • 刘泽新;苗磊 - 华为技术有限公司
  • 2012-03-01 - 2021-02-09 - G10L19/125
  • 本发明实施例公开了一种语音频信号处理方法和装置。一个实施例中,语音频信号处理方法包括:当语音频信号出现带宽切换时,获得当前帧语音频信号对应的初始高频带信号;获得所述初始高频带信号时域全局增益参数;将能量比值和所述时域全局增益参数进行加权处理,得到的加权值作为预测的全局增益参数,其中,能量比值为历史帧高频带时域信号能量与当前帧初始高频带信号能量的比值;利用预测的全局增益参数对所述初始高频带信号进行修正,获得修正的高频带时域信号;合成当前帧的窄频带时域信号和所述修正的高频带时域信号并输出。
  • 基于神经网络的音频编码方法及装置、编码器-202010296175.7
  • 闫玉凤;肖全之;方桂萍;黄荣均 - 珠海市杰理科技股份有限公司
  • 2020-04-15 - 2020-11-06 - G10L19/12
  • 本发明提供了一种基于神经网络的音频编码方法及装置、编码器。音频编码方法包括:对原始音频数据进行预处理;对预处理后的音频数据进行运算处理得到线性预测音频数据、线谱对数据或线谱频率数据;将线性预测音频数据或者线谱对数据或线谱频率数据作为输入数据,输入用于量化的神经网络模型,得到音频关联数据;根据音频关联数据确定量化后的线谱频率数据;将量化后的线谱频率数据进行内插处理后经第三域变换得到量化后的线性预测音频数据;按后续的编码协议进行运算,得到音频编码数据。本发明提供的音频编码方法运算量小,神经网络模型的大小比较灵活,可以根据具体的精度需求灵活调整神经网络的大小,以减少使用的数据带宽。
  • 用于降低时域解码器中的量化噪声的装置和方法-201911163569.9
  • T.韦兰考特;M.杰利内克 - 沃伊斯亚吉公司
  • 2014-01-09 - 2020-05-19 - G10L19/12
  • 本公开涉及一种用于降低在由时域解码器解码的时域激励中包含的声音信号中的量化噪声的装置和方法。基于解码后的时域激励,评估未来的帧的时域激励。连结解码后的时域激励和未来的帧的外推的时域激励,以形成连结的时域激励。连结的时域激励被转换为频域激励。产生加权掩模用于取回在量化噪声中丢失的频谱信息。通过应用加权掩模修改频域激励以增大频谱动态。修改的频域激励被转换为修改的时域激励。其中修改的频域激励到修改的时域激励的转换是无延迟的。所述方法和装置可以用于改进基于线性预测的编解码器的音乐内容呈现。
  • 相位对重构语音声调感知影响方法及在人工耳蜗中应用-201510066246.3
  • 田岚;郭翠翠;魏莹 - 山东大学
  • 2015-02-09 - 2017-10-27 - G10L19/12
  • 本发明公开了相位对重构语音声调感知影响方法及在人工耳蜗中应用,采用傅立叶变换分析方法,首先对原始语音信号作频域分解,通过改变信号相位谱特征,重构合成新的语音,进而测听重构音的声调感知。实验发现,采用常用窗长分析和重构时,在信号幅频特征不变、初始相位全部置零条件下,得到的重构音节音质会下降,表明相位特征对声调感知是有影响的,且与信号重构窗长有关。进一步采用声音嵌合重构方法,即用来自不同调型音节的幅频特征与相位特征交叉嵌合、重构音节,测听嵌合重构音的声调感知,由此验证调型的感知主要取决于相位特征。
  • 一种无损音频压缩编码方法及其解码方法-201410441330.4
  • 陆许明;徐永键;李佳男;谭洪舟 - 东莞中山大学研究院;中山大学
  • 2014-09-01 - 2014-12-17 - G10L19/12
  • 本发明提供一种无损音频压缩编码方法及其解码方法,编码方法包括以下步骤:S1:采用自适应分帧技术对原始PCM音频信号进行分帧得到分帧信息和分帧信号,把分帧信息纳入边信息;S2:对每一帧信号进行改进的离散余弦变换得到残余频谱和变换信号;S3:对每一帧变换信号进行声道去相关;S4:利用线性预测参数对进行声道去相关后的每一帧进行线性预测得到残差信号;S5:将残差信号和残余频谱一起进行熵编码得到熵编码的码本,并将其转换成压缩的比特流输出;S6:将S4中线性预测用到的线性预测参数和S5中得到的熵编码的码本纳入S1中的边信息中。
  • 用于语音编码的混合码本激励的系统和方法-201380009887.4
  • 高扬 - 华为技术有限公司
  • 2013-07-29 - 2014-10-29 - G10L19/12
  • 根据实施例,一种编码音频/语音信号的方法包括基于输入音频/语音信号确定混合码本向量,所述混合码本向量包括来自第一码本的第一码本条目和来自第二码本的第二码本条目的总和。所述方法进一步包括基于所述确定的混合码本向量生成已编码的音频信号,以及发送所述确定的混合码本向量的码激励索引。
  • 语音编码器及其代数码表搜索方法和装置-201210174882.4
  • 徐晶明;林福辉;李昙;吴晟;张本好 - 展讯通信(上海)有限公司
  • 2012-05-31 - 2013-12-18 - G10L19/12
  • 本发明公开了一种语音编码代数码表搜索方法和装置,及语音编码器,涉及语音编码技术领域。该方法包括:确定第1个冲激的候选位置;对于第2个冲激到第M个冲激依次分别:确定第i个冲激的候选位置ik;确定每个候选位置ik在前一个冲激的最优关联候选位置(i-1)t,使得由候选位置ik和最优关联候选位置(i-1)t的关联序列组成的候选位置ik的关联序列具有最大的相似度值;选择第M个冲激的具有最大相似度值的候选位置关联序列。该方法整个搜索过程需要在N个信号位置搜索到M个冲激,其复杂度为O(N*N*M),能得到比AMR等语音编码标准中规定的代数码表搜索方法更优的冲激序列,从而提高语音编码质量。
  • 语音编码中代数码表的搜索方法及装置,语音编码方法-201210118462.4
  • 徐晶明;李昙;林福辉;吴晟;张本好 - 展讯通信(上海)有限公司
  • 2012-04-20 - 2013-10-30 - G10L19/12
  • 一种语音编码中代数码表的搜索方法及装置,语音编码方法及系统,所述语音编码中代数码表的搜索方法包括:基于编码模式,获取各种备选的代数码表搜索策略的运算复杂度;基于系统的性能参数和所述备选的代数码表搜索策略的运算复杂度,确定目标代数码表搜索策略,所述目标代数码表搜索策略包括待遍历搜索的音轨的数目;基于所确定的目标代数码表搜索策略,搜索所述编码模式对应的代数码可选信号位置,获得对应所述编码模式的代数码表。本发明的技术方案可以平衡代数码表搜索的运算复杂度,编码质量以及系统性能之间的关系。
  • 生成用于编码信息信号的候选码矢的方法和设备-201310116042.7
  • 詹姆斯·P·阿什利;乌达·米塔尔 - 摩托罗拉移动有限责任公司
  • 2013-04-03 - 2013-10-23 - G10L19/12
  • 本发明公开了一种生成用于编码信息信号的候选码矢的方法和设备。该方法(300)和设备(100)生成用于编码信息信号的候选码矢。该方法可以包括:从接收到的输入信号产生(310)目标矢量。该方法可以包括:基于目标矢量来构建(320)多个反加权函数。该方法可以包括:评估(330)与该多个反加权函数中的每一个相关联的误差值,以产生固定码本码矢。该方法可以包括:生成(340)表示固定码本码矢的码字,其中,该码字可以由解码器使用来生成输入信号的近似。
  • 一种语音频信号处理方法和装置-201210051672.6
  • 刘泽新;苗磊 - 华为技术有限公司
  • 2012-03-01 - 2013-09-11 - G10L19/125
  • 本发明实施例公开了一种语音频信号处理方法和装置。一个实施例中,语音频信号处理方法包括:当语音频信号出现带宽切换时,获得当前帧语音频信号对应的初始高频带信号;获得所述初始高频带信号时域全局增益参数;将能量比值和所述时域全局增益参数进行加权处理,得到的加权值作为预测的全局增益参数,其中,能量比值为历史帧高频带时域信号能量与当前帧初始高频带信号能量的比值;利用预测的全局增益参数对所述初始高频带信号进行修正,获得修正的高频带时域信号;合成当前帧的窄频带时域信号和所述修正的高频带时域信号并输出。
  • 一种最大相关系数的优化方法及其装置-201110415344.5
  • 付宝玲;高超;李桂满 - 联芯科技有限公司
  • 2011-12-13 - 2013-06-19 - G10L19/12
  • 本发明实施例提供了一种最大相关系数的优化方法及其装置,针对语音压缩中相关系数计算的逐点进行乘累加的过程,本发明的方法包括:将当前子帧的N个采样点与前一帧的N个采样点,或将当前子帧的N个采样点与前一帧和当前帧的N个采样点,或将当前子帧的N个采样点与当前帧的N个采样点,采用隔点进行乘积,并将乘积的结果进行求和,其中N为自然数。本发明实施例是通过降低第一级粗化搜索的每次相关性计算过程中的求值点个数来降低N个采样点范围内的乘累加次数,从而降低运算量,达到性能优化的目的,即在语音质量允许的范围内通过损失一定的粗化搜索的精确度换取运算量较大的下降。
  • 用于宽带语音解码中噪声增强后处理的方法及装置-201210436081.0
  • 张勇;闫建新 - 深圳广晟信源技术有限公司
  • 2012-11-05 - 2013-03-13 - G10L19/12
  • 本发明涉及一种用于宽带语音解码中噪声增强后处理的方法和装置。所述方法包括:S1、检测当前帧的语音/非语音特性,计算出当前帧的噪声因子;S2、确定该噪声因子是否大于一预设的门限值;S3、在噪声因子大于预设的门限值时,对当前帧的固定码矢执行能量平滑处理,得到经过能量平滑后的固定码矢;S4、将当前帧的自适应码矢与该经过能量平滑后的固定码矢相加,合成激励信号。本发明还涉及一种用于宽带语音解码的方法和解码器。本发明通过解码语音信号的噪声因子的特性对固定码矢的能量进行平滑,从而达到噪声增强的目的。本发明能够适用于各种语音编解码器,算法运算复杂度比较低,并且不额外增加传输码率。
  • 一种基于G729语音压缩编码算法的DSP优化方法-201210344525.8
  • 徐驭航;陈磊;唐先成;王亮;蔡自伟;宋宁帅;王牌;龙涛 - 重庆大学
  • 2012-09-18 - 2013-01-30 - G10L19/12
  • 一种基于G729语音压缩编码算法的DSP优化方法,其特征在于按下列步骤进行:使用CCS3.3版本的DSP软件开发环境并将G729语音编码算法的开源源代码一直到TMS320C55X上,成功对语音编码;对算法中的LPC阶段进行多项式求根算法的改进,在固定码本搜索阶段,对码本的搜索算法进行了优化,在矢量距离的计算过程中,对距离搜索的过程进行了简化;对编译器进行设置;依次在C语言层面和汇编层面,对一些模块函数进行改写。本发明显著效果是:提供了一种基于G729语音压缩编码算法的DSP优化方法,具有编码时间短的优点,能够解决多路语音在DSP上实时编码的困难。
  • 一种适用于语音压缩感知的过完备字典构造方法-201210380638.3
  • 孙林慧;杨震;杨真真 - 南京邮电大学
  • 2012-10-10 - 2013-01-16 - G10L19/12
  • 本发明公开一种适用于语音压缩感知的过完备字典构造方法,步骤为:首先在训练阶段由大量的训练语音构造过完备的线性预测字典,然后在实测阶段采用随机高斯矩阵作为观测矩阵对语音信号进行CS采样;最后基于前述线性预测字典采用BP算法高质量重构语音信号。此方法不需要测试语音的预测系统,且构造方法简单,语音信号在过完备线性预测字典下呈现良好的稀疏性,基于过完备线性预测字典的语音压缩感知重构信号性能良好,且具有较好的鲁棒性。
  • 处理音频信号的方法和装置-201180015619.4
  • 丁奎赫;金大焕;李昌宪;金洛榕;田惠晶;李炳锡;姜仁圭 - LG电子株式会社
  • 2011-03-23 - 2012-12-05 - G10L19/12
  • 本发明涉及用于处理音频信号的方法,包括以下步骤:执行音频信号的当前帧的频谱分析,以确定指示当前帧对应于包括第一频带和第二频带的多个频带中的哪一个的带宽信息;基于该带宽信息来确定关于与当前帧对应的阶数(order)的信息;执行当前帧的线性预测分析,以生成第一阶数的第一组线性预测变换系数;对第一组线性预测系数执行向量量化以生成第一组索引;执行当前帧的线性预测分析,以根据关于阶数的信息来生成第二阶数的第二组线性预测变换系数;以及当生成了第二组线性预测系数时,通过使用第一组索引和第二组线性预测变换系数,对第二组差执行向量量化。
  • 基于残差信号频谱重构的声码器-201210253946.X
  • 陶建华;温正棋 - 中国科学院自动化研究所
  • 2012-07-20 - 2012-10-24 - G10L19/12
  • 本发明提供了一种基于残差信号频谱重构的声码器,包括:参数提取模块,用于接收待分析的语音数据、计算基频参数和频谱参数;逆滤波模块,用于根据频谱参数设计逆滤波器对语音数据逆滤波,获得残差信号;周期信号支路,与逆滤波模块相连接,用于根据基频参数和逆滤波后的残差信号,生成周期激励信号;非周期信号支路,与逆滤波模块相连接,用于根据基频参数和逆滤波后的残差信号,生成非周期激励信号;以及参数语音合成器模块,与周期信号支路和非周期信号支路相连接,用于根据周期频谱参数、周期激励信号和非周期激励信号,调用语音合成器合成语音。本发明对逆滤波后的残差信号进行建模,使激励信号具有较高的准确性,提高了合成语音的音质。
  • 基于语音功率谱的低速率语音编码方法-201210119567.1
  • 汤一彬;张德国;李枭雄;单鸣雷;朱昌平;韩庆邦;高远;殷澄 - 河海大学常州校区
  • 2012-04-20 - 2012-09-12 - G10L19/12
  • 本发明公开了一种基于语音功率谱的低速率语音编码方法,具体涉及到基于字典学习的信号稀疏表示和重构的语音处理技术。它采用以语音功率谱为主要输出参数的高效语音模型为低速率语音编码的模型,在发送端,语音信号经处理后输出语音功率谱,随后该参数通过稀疏理论进行压缩,最终转换成比特流,实现无线传输。采用接收端的字典学习方法,为低速率语音通信得以实现提供保障,并利用前帧合成语音的各种信息进行最大化的字典学习;采用基于能量的稀疏系数与字典原子的匹配,构造测量矩阵使得匹配的正确性得以提高,实现在接收端语音功率谱的最优恢复。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top