[发明专利]信号处理设备、信号处理方法和程序无效

专利信息
申请号: 201210165069.0 申请日: 2012-05-24
公开(公告)号: CN102810315A 公开(公告)日: 2012-12-05
发明(设计)人: 井上晃;向井昭广 申请(专利权)人: 索尼公司
主分类号: G10L19/00 分类号: G10L19/00
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 杜诚;贾萌
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 信号 处理 设备 方法 程序
【说明书】:

技术领域

本技术涉及一种信号处理设备、信号处理方法和程序,尤其涉及其中通过时间轴域处理来解压缩或压缩音频信号的信号处理设备、信号处理方法和程序。

背景技术

作为用于音频信号的时间轴域解压缩和压缩算法,指针间隔受控叠加和添加(PICOLA,Pointer Interval Controlled Overlap and Add)众所周知且被使用,该指针间隔受控叠加和添加是简单的处理且获得高声音质量的处理结果(例如,参见Morita Naotaka,Itakura Fumitada,“Audio Decompression and Compression in Time Axis Using Pointer Interval Controlled OverLap and Add(PICOLA)based on Pointer Movement Amount Control,and Evaluation Thereof,”Proceedings of the Acoustical Society of Japan,issued October 1986,p.149-150)。

图1是示出用于根据PICOLA算法通过时间轴域处理来压缩音频信号的回放速度转换设备的配置的例子的框图。

图1的回放速度转换设备10包括记录单元11、处理缓冲器单元12、基音(pitch)计算单元13、运算单元14、处理控制单元15和累积单元16。音频信号的回放速度乘以R(R>1)。

回放速度转换设备10的记录单元11按时间顺序记录作为脉冲编码调制(PCM)信号的音频信号。记录单元11经由直接存储器存取(DMA)以记录顺序将记录的音频信号传输到处理缓冲器单元12。

处理缓冲器单元12以接收顺序临时存储从记录单元11DMA-传输的音频信号。此外,基于从处理控制单元15提供的开始位置P和从基音计算单元13提供的基音周期T0,处理缓冲器单元12读取从开始位置P的样本起在两个基音周期T0中的样本的音频信号。

开始位置P是压缩开始位置的样本的样本编号,且样本编号是按顺序给予按时间顺序存储在处理缓冲器单元12中的音频信号的每个样本的编号。基音周期T0是音频信号的基音周期中的样本的数量。

处理缓冲器单元12将所读取的音频信号作为算术处理信号提供给运算单元14。此外,处理缓冲器单元12基于开始位置P和基音周期T0确定位置P+T0,P+T0是从开始位置P的样本起的第T0个样本的样本编号。处理缓冲器单元12以从运算单元14提供的压缩算术处理信号覆盖从位置P+T0的样本起的基音周期T0中的样本的所存储的音频信号。

此外,处理缓冲器单元12基于从外部输入的回放速度转换比R和从基音计算单元13提供的基音周期T0,使用以下等式(1)获得指示回放速度转换后的音频信号的样本数目的回放信号长度L。

此外,回放速度转换比R是累积单元16中记录的回放速度转换后的音频信号与记录单元11中记录的回放速度转换前的音频信号的长度比。例如通过用户操纵未示出的输入单元将回放速度转换比R输入到处理缓冲器单元12和处理控制单元15。

L=T0×1R-1···(1)]]>

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210165069.0/2.html,转载请声明来源钻瓜专利网。

同类专利
  • 用于编码多通道音频信号的参数编码器-201080033764.0
  • 克里斯托弗·富勒;苗磊;郎玥;许剑峰 - 华为技术有限公司
  • 2010-11-03 - 2012-12-26 - G10L19/00
  • 本发明涉及一种用于编码具有第一音频信号和第二音频信号的多通道音频信号的参数编码器。所述参数编码器具有:变换器(101),用于将所述第一音频信号变换到频域中,以获得第一变换后的音频信号,且用于将所述第二音频信号变换到频域中,以获得第二变换后的音频信号;参数生成器(107),用于在第一频率下由所述第一变换后的音频信号及所述第二变换后的音频信号生成第一编码参数,且用于在第二频率下由所述第一变换后的音频信号及所述第二变换后的音频信号生成第二编码参数;以及参数组合器(109),用于组合所述第一编码参数与所述第二编码参数,以获得经组合的编码参数。
  • 指令处理方法、装置和系统-201210282268.X
  • 梅敬青;薛国栋 - 华为终端有限公司
  • 2012-08-09 - 2012-12-19 - G10L19/00
  • 本发明实施例提供一种指令处理方法、装置和系统,方法包括:接收语音解析服务器发送的多条语音指令,多条语音指令为语音解析服务器对来自不同语音控制设备的源语音命令进行解析后生成的;分别判断多条语音指令中任意两条语音指令是否为相似指令,相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令;当多条语音指令中存在两条语音指令为相似指令时,丢弃两条相似的语音指令中的一条语音指令。本发明实施例还提供了一种指令处理装置和系统。本实施例消除了命令重复执行带来的控制错误。
  • 一种快速破坏广播音频文件病毒的方法-201210138517.8
  • 甘涛;何艳敏;黄晓革;周南;兰刚 - 电子科技大学
  • 2012-05-07 - 2012-12-19 - G10L19/00
  • 本发明提供一种快速破坏广播音频文件病毒的方法,逐一对编码流中的音频帧进行量化比特位的调整,将经重量化编码后的音频帧重新写入编码流中;在参与当前音频帧编码的所有通道子带中先选择1个通道子带进行位分配减1调整,再选择1个或多个通道子带进行位分配加1调整,本发明不需要将音频解码成PCM形式,而是仅在压缩域对少数几个通道子带的样本进行简单处理,其计算复杂度很低,并且可大范围的对音频文件进行改变,进而保证对藏匿在音频文件中的病毒进行破坏。
  • 一种生成并解码音频信号的装置-201220205739.2
  • 黄智谦;樊仲然;樊浩然;霍俊康 - 毅昇科技有限公司
  • 2012-05-09 - 2012-12-19 - G10L19/00
  • 本实用新型公开了一种生成并解码音频信号的装置,包括声音生成器件和声音接收器件,声音生成器件包括控制单元和声音生成单元,控制单元和声音生成单元连接,控制单元确定传输的音频信号并使用各种超声频率对传输的音频信号进行编码,声音生成单元输出编码后的音频信号;声音接收器件包括话筒和处理单元,话筒和处理单元连接,话筒接收通过声音生成单元生成的声音,并且处理单元解码该声音并重获通过声音生成单元传输的音频信号。本装置不需要借助互联网数据,也没有图像大小及清晰度的限制,适用于中短距离的数据传输,以及一对多人的数据传输。
  • 音频解码方法及装置-201110147225.6
  • 赵云轩;刘智辉 - 华为终端有限公司
  • 2011-06-02 - 2012-12-05 - G10L19/00
  • 本发明实施例公开了一种音频解码方法及装置。音频解码方法包括:接收数据包;当检测到发生数据包丢包,且N个声道中的M个声道的对应某一音频帧的音频数据丢失时,若N个声道中除所述M个声道之外的其他声道的,与所述音频帧中已丢失的音频数据属于相同音频帧的音频数据未丢失,则对未丢失的音频数据进行解码;提取解码后得到的信号特征参数;判断第一声道与第二声道之间是否具有相关性;若具有,则根据所述第二声道对所述第一声道的对应所述音频帧的已丢失的音频数据进行丢包隐藏处理。本发明实施例还提供一种音频解码装置。本发明实施例能够有效提高音频解码时丢包隐藏处理的效果。
  • 音频编码方法及装置、音频解码方法及装置、编解码系统-201110147298.5
  • 赵云轩;张金亮 - 华为终端有限公司
  • 2011-06-02 - 2012-12-05 - G10L19/00
  • 本发明实施例公开了一种音频编码方法及装置、音频解码方法及装置、编解码系统,能够提高音频数据传输过程中的抗丢包性能。本发明实施例方法应用于至少包含2个声道的音频编解码系统,该方法包括:获取N个声道的音频数据;对获取到的N个声道的音频数据进行声道交织打包得到数据包,每个数据包中包含X*N段音频数据,X为一个数据包中的音频数据的数目与一个音频帧中的音频数据的数目的比值,X为大于或等于1的整数;所述X*N段音频数据中,至少有X+1段音频数据属于不同的音频帧。本发明实施例还提供一种音频解码方法,相关装置以及编解码系统。本发明实施例能够有效提高音频数据传输过程中的抗丢包性能。
  • 语音合成系统-201110145962.2
  • 谈宏量 - 北京市特立信电子技术有限责任公司
  • 2011-06-01 - 2012-12-05 - G10L19/00
  • 本发明公开了语音合成系统,包括:分别位于多个会场的多个语音编解码装置,以及分别与编解码装置和混音装置连接的多业务传送装置。本发明能够满足会议成员分散各地的指挥控制系统召开会议的要求,并满足会议成员数较多和实时自由发言的要求,使得最大64方会议成员可以在进入会议后,无需作任何发言申请操作而可以自由发言。
  • 信号处理设备、信号处理方法和程序-201210165069.0
  • 井上晃;向井昭广 - 索尼公司
  • 2012-05-24 - 2012-12-05 - G10L19/00
  • 提供一种信号处理设备、方法和程序。计算N的倍数作为音频信号的基音周期中样本的数目,N是等于或大于1的整数。顺序地把这样的样本确定为音频信号的时间轴域上解压缩或压缩处理的开始位置的样本:该样本是从紧接在开始位置之前的开始位置起的第M1个样本,M1是N的倍数。在时间轴域上解压缩或压缩从音频信号的开始位置的样本起的长度L1中的样本,并将解压缩或压缩之后的音频信号的样本数目设为N的倍数,L1等于预定数目乘以基音周期。用进行解压缩或压缩之后的音频信号覆盖从自开始位置起第M2个样本到解压缩或压缩之后的音频信号的样本的所存储音频信号,并从覆盖开始位置的样本起发送覆盖后的音频信号,M2等于预定数目乘以基音周期。
  • 一种数字音频压缩装置-201120544803.5
  • 熊璞;张磊;张永恒 - 成都众询科技有限公司
  • 2011-12-23 - 2012-12-05 - G10L19/00
  • 本实用新型提供了一种数字音频压缩装置,其组成:包括顺序连接的麦克风、运算放大器、滤波器和A/D转化器;还包括与RAM连接通信串口和FLASH1;还包括与DSP连接双口RAM、SDRAM和FLASH1;还包括与FPGA连接双口RAM、A/D转换器和ARM。本实用新型采用FPGA作为主要逻辑控制芯片,DSP作为语音压缩算法处理芯片,通过实现三者之间的数据交换,从而实现ARM+FPGA+DSP的多处理器整合平台,使得整个系统的处理能力和外围扩展能力都得到极大的提高。
  • 一种无线音频采集卡-201120544813.9
  • 熊璞;张磊;张永恒 - 成都众询科技有限公司
  • 2011-12-23 - 2012-12-05 - G10L19/00
  • 本实用新型提供了一种无线音频采集卡,包括用于采集模拟音频信号的麦克风、用于将采集到的音频信号放大的运算放大器、用于放大后的音频信号进行滤波的滤波器、用于将经过滤波后的模拟音频信号转换为数字音频信号的A/D转换器,用于对数字音频信号进行压缩处理和处理的DSP,用于将压缩和处理后的音频信号进行存储和上传到PC的FPGA、用于存储系统程序的FLASH、用于数据缓存的SRAM、用于存储采集到的音频信号的SD存储卡,还包括用于对采集到的音频数据进行播放的音频播放单元,且其通过无线网络进行信号传输,在地理环境条件差,布线不方便的地方能够方便的使用。
  • 优化的参数立体声解码-201080057443.4
  • B·科维塞;S·拉格特;T·M·N·霍恩格 - 法国电信公司
  • 2010-10-15 - 2012-12-05 - G10L19/00
  • 本发明涉及一种用于立体声数字音频信号的参数解码的方法,包括:合成步骤(synth.),用于针对频率子带,基于从立体声信号的缩混产生的公式(I)的已解码单声道信号和根据立体声信号的空间信息参数,来合成立体声信号,使得所获得的信号具有以下形式:公式(II),其中公式(III)和公式(IV)表示合成信号的声道,公式(V)和公式(VI)表示取决于已解码单声道信号的信号,以及c1[j]和c2[j]表示增益。所述增益的特征在于它们按照以下方式计算:公式(VII),其中公式是从解码的参数获得的、在立体声信号的两个声道之间的幅度比。本发明还涉及用于实现所述方法的解码器。
  • 音频编解码组件、音频编解码器识别方法及系统-201210222466.7
  • 赵伟;谢鑫刚;宋建峰;刘丞 - 大唐移动通信设备有限公司
  • 2012-06-28 - 2012-11-28 - G10L19/00
  • 本申请提供了一种音频编解码组件,包括音频编解码器和用于存储唯一识别音频编解码器的硬件信息标识符的硬件信息标识存储模块。本申请还提供了一种识别前述音频编解码组件的音频编解码器识别方法,包括以下步骤:读取音频编解码器的硬件信息标识符;为所述音频编解码器分配驱动识别号,并将所述硬件信息标识符与驱动识别号关联;根据所述硬件信息标识符与驱动识别号的关联信息识别所述音频编解码器,并对所述音频编解码器进行操作控制。本申请还提供了一种实现前述方法的音频编解码器识别系统。本申请的音频编解码组件、音频编解码器识别方法及系统,能够实现同一设备下多接口接入的音频编解码器的快速准确识别,且成本较低。
  • 音频数据流的发送、接收装置及方法-201210217773.6
  • 梁捷;俞永福;何小鹏;朱顺炎;温才燚 - 优视科技有限公司
  • 2012-06-27 - 2012-11-28 - G10L19/00
  • 本发明公开了一种音频数据流的发送、接收装置及方法,在上述装置中,处理模块,用于对当前采集的待发送的音频数据流进行划分,并根据划分后的各段音频数据流中的静音数据流执行过滤处理并记录被过滤的数据流在待发送的音频数据流中的位置信息,其中,被过滤的数据流是由划分后的各段音频数据流的能量值确定的;编码模块,用于对经过处理模块处理后的音频数据流进行编码处理;发送模块,用于将经过编码模块处理后的音频数据流以及指示信息进行发送,其中,该指示信息中携带有处理模块记录的被过滤的数据流在待发送的音频数据流中的位置。根据本发明提供的技术方案,通过消除噪音数据提高了通话质量,降低了网络流量和移动终端耗电量。
  • 编码方法、解码方法、利用了这些方法的装置、程序-201080026551.5
  • 堤公孝;佐佐木茂明;日和崎佑介;福井胜宏 - 日本电信电话株式会社
  • 2010-06-22 - 2012-11-28 - G10L19/00
  • 高质量地合成解码信号。本发明的编码方法具有本地解码系数搜索步骤。本地解码系数搜索步骤包括复制判定子步骤、复制偏移候补信号串生成子步骤、距离计算子步骤、以及距离最小偏移量检测子步骤。复制判定子步骤对每个编码对象信号串,根据解码信号串判定是否生成复制偏移候补信号串,并输出复制判定标记。复制偏移候补信号串生成子步骤在复制判定标记表示生成复制偏移候补信号串的情况下,对预先决定的全部的信号偏移量的候补,生成复制偏移候补信号串。距离计算子步骤计算用于表示预先决定的信号串之间的距离的参数。距离最小偏移量检测子步骤求出距离最小的信号偏移量。
  • 音频信号的上混合-201080024766.3
  • A.C.登布林克;A.S.哈马 - 皇家飞利浦电子股份有限公司
  • 2010-05-31 - 2012-11-28 - G10L19/00
  • 一种音频设备,包括用于提供一组音频声道的处理器(101)。预测电路(103)通过用自适应滤波器对于第二声道进行自适应滤波而生成对于第一声道的预测信号。适配处理器(105)适配该自适应滤波器,以使得指示在预测信号与第一声道之间的差异的代价函数最小化。补偿处理器(107)然后通过对于预测信号来补偿第一信号而生成非预测信号,以及分布处理器(109)通过把至少预测信号和非预测信号分布在输出的音频信号组上而生成输出的音频声道组,其中所述分布对于预测信号和非预测信号是不同的。交叉声道预测滤波提供了代表始发的声音的不同空间特性且因此被有利地对于输出声道被不同地分布的信号分量。
  • 语音处理装置、语音处理方法和程序-201180013301.2
  • 户栗康裕;铃木志朗;松本淳;前田祐儿;松村祐树 - 索尼公司
  • 2011-03-08 - 2012-11-21 - G10L19/00
  • 本发明涉及一种当多声道音频信号被下混合和编码时在音频信号解码时防止延迟和计算量增加的语音处理装置、语音处理方法和程序。逆复用单元(101)获取在其上复用BC参数的编码数据。不相关频率-时间变换单元(102)执行根据这一编码数据获得的单耳信号(XM)的频域系数的IMDCT变换和IMDST变换,以生成单耳信号(XM)(该信号是时域信号)和与这一单耳信号(XM)基本上不相关的信号(XD’)。立体声合成单元(103)通过使用BC参数合成单耳信号(XM)和信号(XD’)来生成立体声信号。本发明例如适用于一种对下混合和编码的立体声信号进行解码的语音处理装置。
  • 用于双核编码模式的编码方法和系统-201210264075.1
  • 王磊;闫建新 - 深圳广晟信源技术有限公司
  • 2012-07-27 - 2012-11-14 - G10L19/00
  • 本发明涉及用于双核编码模式的编码方法和系统。该方法包括:判断输入信号是类音乐信号还是类语音信号;对所述输入信号进行环绕声编码,并判断所述输入信号是否为立体声信号或者多声道信号;对所述输入信号进行环绕声参数提取后进行增强频带复制;对增强频带复制后的所述输入信号进行第一比特控制或第二比特控制;对于经历第一比特控制的所述输入信号进行频域编码,对经历第二比特控制的所述输入信号进行线性预测域编码;对所述输入信号进行量化编码,最后通过多路复用对获得的所有编码数据和边信息进行多路复用。实施本发明的用于双核编码模式的编码方法及系统,可以提高混合信号的编码质量。
  • 对多声道音频信号进行编码/解码的系统、介质和方法-201210190880.4
  • 金重会;苗磊;吴殷美 - 三星电子株式会社
  • 2006-11-21 - 2012-11-14 - G10L19/00
  • 一种对多声道音频信号进行编码/解码的系统、介质和方法,所述系统包括:解码级别产生单元,产生用于将包括一定数量的音频声道信号和空间信息的比特流解码为一定数量的音频声道信号的解码级别信息,其中,所述空间信息包括关于相应的声道之间的幅值差和/或相似性的信息;音频解码器,根据解码级别信息对比特流进行解码。因此,即使单个输入流也可基于使用的扬声器配置的类型被选择性地解码为合适数量的声道。可通过对输入的比特流进行部分地解码来实现可伸缩声道解码。在可伸缩声道解码中,解码器可设置解码级别,并根据解码级别输出音频声道信号,从而可降低解码复杂性。
  • 对多声道音频信号进行编码/解码的系统、介质和方法-201210191747.0
  • 金重会;苗磊;吴殷美 - 三星电子株式会社
  • 2006-11-21 - 2012-11-14 - G10L19/00
  • 一种对多声道音频信号进行编码/解码的系统、介质和方法,所述系统包括:解码级别产生单元,产生用于将包括一定数量的音频声道信号和空间信息的比特流解码为一定数量的音频声道信号的解码级别信息,其中,所述空间信息包括关于相应的声道之间的幅值差和/或相似性的信息;音频解码器,根据解码级别信息对比特流进行解码。因此,即使单个输入流也可基于使用的扬声器配置的类型被选择性地解码为合适数量的声道。可通过对输入的比特流进行部分地解码来实现可伸缩声道解码。在可伸缩声道解码中,解码器可设置解码级别,并根据解码级别输出音频声道信号,从而可降低解码复杂性。
  • 对多声道音频信号进行编码/解码的系统、介质和方法-201210191191.5
  • 金重会;苗磊;吴殷美 - 三星电子株式会社
  • 2006-11-21 - 2012-11-14 - G10L19/00
  • 一种对多声道音频信号进行编码/解码的系统、介质和方法,所述系统包括:解码级别产生单元,产生用于将包括一定数量的音频声道信号和空间信息的比特流解码为一定数量的音频声道信号的解码级别信息,其中,所述空间信息包括关于相应的声道之间的幅值差和/或相似性的信息;音频解码器,根据解码级别信息对比特流进行解码。因此,即使单个输入流也可基于使用的扬声器配置的类型被选择性地解码为合适数量的声道。可通过对输入的比特流进行部分地解码来实现可伸缩声道解码。在可伸缩声道解码中,解码器可设置解码级别,并根据解码级别输出音频声道信号,从而可降低解码复杂性。
  • 对多声道音频信号进行编码/解码的系统、介质和方法-201210191302.2
  • 金重会;苗磊;吴殷美 - 三星电子株式会社
  • 2006-11-21 - 2012-11-14 - G10L19/00
  • 一种对多声道音频信号进行编码/解码的系统、介质和方法,所述系统包括:解码级别产生单元,产生用于将包括一定数量的音频声道信号和空间信息的比特流解码为一定数量的音频声道信号的解码级别信息,其中,所述空间信息包括关于相应的声道之间的幅值差和/或相似性的信息;音频解码器,根据解码级别信息对比特流进行解码。因此,即使单个输入流也可基于使用的扬声器配置的类型被选择性地解码为合适数量的声道。可通过对输入的比特流进行部分地解码来实现可伸缩声道解码。在可伸缩声道解码中,解码器可设置解码级别,并根据解码级别输出音频声道信号,从而可降低解码复杂性。
  • 对多声道音频信号进行编码/解码的系统、介质和方法-201210191134.7
  • 金重会;苗磊;吴殷美 - 三星电子株式会社
  • 2006-11-21 - 2012-11-14 - G10L19/00
  • 一种对多声道音频信号进行编码/解码的系统、介质和方法,所述系统包括:解码级别产生单元,产生用于将包括一定数量的音频声道信号和空间信息的比特流解码为一定数量的音频声道信号的解码级别信息,其中,所述空间信息包括关于相应的声道之间的幅值差和/或相似性的信息;音频解码器,根据解码级别信息对比特流进行解码。因此,即使单个输入流也可基于使用的扬声器配置的类型被选择性地解码为合适数量的声道。可通过对输入的比特流进行部分地解码来实现可伸缩声道解码。在可伸缩声道解码中,解码器可设置解码级别,并根据解码级别输出音频声道信号,从而可降低解码复杂性。
  • 使用线性预测滤波的前向时域混叠消除-201180006073.6
  • B.贝塞特 - 沃伊斯亚吉公司
  • 2011-01-13 - 2012-11-07 - G10L19/00
  • 在编码器中,用于产生前向混叠消除(FAC)参数的方法,所述FAC参数用于消除由在具有重叠窗口的使用第一编码模式的第一变换编码帧和具有非重叠窗口的使用第二编码模式的第二帧之间的转换对在所述第一变换编码帧中的编码音频信号造成的时域混叠,包括:计算表示编码前的第一帧的音频信号和第一变换编码帧的编码音频信号的合成之间的差的FAC目标;以及加权所述FAC目标以产生所述FAC参数。在解码器中,加权的前向混叠消除(FAC)参数被接收并逆加权,以产生FAC合成。基于所述第一帧中的编码音频信号的合成,使用所述FAC合成从所述音频信号合成中消除所述时域混叠。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top