[发明专利]话音及文本通信系统、方法及设备有效
申请号: | 200780028278.8 | 申请日: | 2007-07-31 |
公开(公告)号: | CN101496096A | 公开(公告)日: | 2009-07-29 |
发明(设计)人: | 斯蒂芬·莫洛伊;哈利德·希勒米·埃尔-马勒赫 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G10L13/04 | 分类号: | G10L13/04;G10L19/00;G10L15/26 |
代理公司: | 北京律盟知识产权代理有限责任公司 | 代理人: | 刘国伟 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及用以将语音转换成文本及将文本转换成语音的系统、方法及设备。一种设备包括声码器、语音到文本转换引擎、文本到语音转换引擎及用户界面。所述声码器可操作以将语音信号转换成包及将包转换成语音信号。所述语音到文本转换引擎可操作以将语音转换成文本。所述文本到语音转换引擎可操作以将文本转换成语音。所述用户界面可操作以接收用户从多个模式中对一模式的选择,其中第一模式启用所述语音到文本转换引擎,第二模式启用所述文本到语音转换引擎,且第三模式启用所述语音到文本转换引擎及所述文本到语音转换引擎。 | ||
搜索关键词: | 话音 文本 通信 系统 方法 设备 | ||
【主权项】:
1、一种设备,其包括:声码器,其可操作以将语音信号转换成包及将包转换成语音信号;语音到文本转换引擎,其可操作以将语音转换成文本;文本到语音转换引擎,其可操作以将文本转换成语音;及用户界面,其可操作以接收用户从多个模式中对一模式的选择,其中第一模式启用所述语音到文本转换引擎,第二模式启用所述文本到语音转换引擎,且第三模式启用所述语音到文本转换引擎及所述文本到语音转换引擎。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200780028278.8/,转载请声明来源钻瓜专利网。
- 上一篇:多光束带电粒子光学系统
- 下一篇:显示装置
- 同类专利
- 一种基于FPGA的Mel倒谱分析合成仪-201220233638.6
- 杨鸿武;丁朋程;裴东;王全州;甘振业;郭威彤 - 西北师范大学
- 2012-05-23 - 2012-12-19 - G10L13/04
- 本实用新型提供了一种基于FPGA的Mel倒谱分析合成仪,包括分别与LCD显示器、音频芯片、SD卡存储器、FLASH存储器、SRAM存储器和SDRAM存储器相连接的FPGA芯片;FPGA芯片包括Avalon交换架构;NIOSⅡ处理器软核嵌有JTAG调试模块。利用MCC的值调节Mel倒谱逼近滤波器系数,使存储在SD卡中的语音激励源信号通过Mel对数谱逼近滤波器产生语音数据,通过音频芯片将数字音频信号转换成模拟语音信号输出。本倒谱仪不仅能进行大数据量的处理计算,实现语音的分析合成,而且实现了便携化和仪器化。
- 语音合成设备-201210179123.7
- 才野庆二郎 - 雅马哈株式会社
- 2012-06-01 - 2012-12-05 - G10L13/04
- 本发明提供了一种语音合成设备,其被设计来用于使用多个语音段数据合成语音信号,每个语音段数据表示含有至少两个对应于不同音素的音素片段的语音段。在该设备中,语音段调整器根据第一语音段和第二语音段来形成目标片段,以便将第一语音段和第二语音段相互连接,使得所述目标片段由第一语音段的后部音素片段和第二语音段的前部音素片段形成,并且所述语音段调整部分将所述目标片段扩展到目标时间长度以形成调整片段,使得以比所述目标片段的前部分和后部分的扩展率高的扩展率来扩展所述目标片段的中间部分,从而产生具有所述目标时间长度的调整片段的合成语音段数据。语音合成器根据由所述语音段调整部分产生的合成语音段数据来产生语音信号。
- 语音合成设备-201210175478.9
- 若尔迪·博纳达;梅利因·布洛乌;橘诚 - 雅马哈株式会社
- 2012-05-30 - 2012-12-05 - G10L13/04
- 本发明提供了语音合成设备和语音合方法。在该语音合成设备中,音素段内插器部分获取音素段的与声音特性的第一值对应的第一音素段数据并获取该音素段的与该声音特性的第二值对应的第二音素段数据。第一音素段数据和第二音素段数据表示音素段的每个帧的频谱。音素段内插器在第一音素段数据的每个帧和与第一音素段数据的每个帧相对应的第二音素段数据的每个帧之间进行内插,从而产生音素段的与声音特性的目标值对应的音素段数据,其中该目标值不同于声音特性的第一值和第二值。语音合成器根据所产生的音素段数据来生成具有声音特性的目标值的语音信号。
- 用于能够使用语音的工作环境的训练/指导系统-200980138554.5
- M·B·梅洛特;R·A·贝茨;M·劳赫尔里;J·R·洛根 - 沃科莱特保健系统公司
- 2009-11-13 - 2011-09-07 - G10L13/04
- 语音工作系统包括无线网络和配置用于通过无线网络进行通信的至少两个能够使用语音的设备100、200。上述设备操作用于将系统提示转变成语音以及使用语音识别将语音命令转变成系统命令。第一设备100可由用户130选择性地被激活成指导模式,以通过无线网络40建立与第二设备200和另一用户230的连接。一旦以指导模式连接,进行指导的用户130接收来自接受指导的用户230和第二设备200的系统提示。之后进行指导的用户的第一设备100将那些接收到的提示提供给进行指导的用户130。
- 用于提供改进的语音合成的方法、设备和计算机程序产品-200980120201.2
- J·纽尔米南;T·赖蒂奥;A·叙尼;M·瓦伊尼奥;P·阿尔库 - 诺基亚公司
- 2009-05-19 - 2011-05-04 - G10L13/04
- 一种用于提供改进的语音合成的设备可以包括处理器和存储可执行指令的存储器。响应于处理器对指令的执行,该设备可以执行:至少部分地基于与真实声门脉冲相关联的性质从一个或多个存储的真实声门脉冲中至少选择真实声门脉冲、将选择的该真实声门脉冲用作生成激励信号的基础并且基于模型生成的谱参数来修改激励信号以提供合成语音。
- 用于分布式文本到话音合成以及可理解性的系统和方法-201010153291.X
- 许军;李泰齐 - 创新科技有限公司
- 2010-04-21 - 2010-10-27 - G10L13/04
- 本发明提供了用于分布式文本到话音合成以及可理解性的系统和方法。更具体而言,本发明提供了在手持便携式计算设备上的分布式文本到话音合成,其可以被用于例如生成帮助用户与手持便携式计算设备的用户界面进行交互的可理解的音频提示。该文本到话音分布式系统70从客机设备接收文本串,并且包含文本分析器72、韵律分析器74、文本分析器和韵律分析器所参考的数据库14、以及话音合成器80。话音合成器80的元件驻留在主机设备和客机设备上,并且与文本串相关联的音频文件的音频索引表示是在主机设备处生成并被发送到客机设备的,以用于在客机设备处产生音频文件。
- 自动同步解释系统-200880116632.7
- J·格雷尼埃尔 - 威廉·博纳东
- 2008-11-18 - 2010-10-13 - G10L13/04
- 一种解释系统,包括:源语言的书写语句或发音语句的光学或声音采集装置和声音重建装置;用于基于所述采集装置所采集的输入信号生成源语句的识别装置(30),所述源语句是所述源语言语句的记录;用于生成目标语句的翻译装置(32),所述目标语句是源语句以目标语言的翻译;和用于基于所述目标语句生成能够由所述声音重建装置(3、5)进行重建的输出声音信号的语音合成装置(34)。根据本发明,解释系统包括能够顺序呼叫所述识别装置(30)、所述翻译装置(32)和所述语音合成装置(34)以便实时地生成源语言语句的目标语言解释的平滑装置(40)。
- 语音合成的方法和系统-200810098474.9
- 双志伟;孟繁平;施勤;秦勇 - 国际商业机器公司
- 2008-05-28 - 2009-12-02 - G10L13/04
- 本发明提供一种用于在客户端对文本内容进行语音合成的方法。该方法包括:基于客户端的语料库中的当前语料单元集合S当前,对文本内容进行语音合成;响应于判断需要更新客户端语料库的当前语料单元集合:分析文本内容,并生成具有相应语境特征的目标单元的列表,基于比客户端语料库的当前语料单元集合S当前更丰富的语料单元集合S总,根据语境特征为每个目标单元选择多个候选语料单元,根据多个候选单元为文本内容确定可用于语音合成的语料单元;以及基于所确定的语料单元,更新客户端语料库的当前语料单元集合。本发明还提供相应的系统。根据本发明的技术方案,客户端的TTS系统能够随着用户对该系统的进一步使用自适应的更新语料库,从而获得语音合成质量的有效改善。
- 语音合成装置、方法、程序、系统以及便携式信息终端-200910134594.4
- 高塚进 - 索尼爱立信移动通信日本株式会社
- 2009-04-23 - 2009-10-28 - G10L13/04
- 本发明涉及语音合成装置、方法、程序、系统以及便携式信息终端。该语音合成装置包括:内容选择单元,选择要被转换成语音的文本内容项目;相关信息选择单元,选择相关信息,所述相关信息能够被至少转换成文本并且与所述内容选择单元选择的文本内容项目相关;数据添加单元,将所述相关信息选择单元选择的相关信息转换成文本,并将所述文本的文本数据添加到所述内容选择单元选择的文本内容项目的文本数据;文本到语音转换单元,将从所述数据添加单元提供的文本数据转换成语音信号;和语音输出单元,输出从所述文本到语音转换单元提供的语音信号。
- 自动分割单字语音信号的装置-200820222733.X
- 陈淮琰;韩召宁;杨亚冬 - 无敌科技(西安)有限公司
- 2008-12-02 - 2009-10-07 - G10L13/04
- 本实用新型涉及一种自动分割单字语音信号的装置,该装置包含接收单元、分析单元以及分割单元;接收单元接入分析单元,分析单元接入分割单元,本实用新型完全替代了传统的人工切分单字语音的方式,整个过程不需要人工介入,省时省力,效率高,且大大降低了人为带来的失误率。
- 提供基于语言的交互式多媒体系统的方法、装置和计算机程序产品-200780042946.2
- S·西瓦达斯 - 诺基亚公司
- 2007-11-09 - 2009-09-23 - G10L13/04
- 一种用于提供基于语言的交互式多媒体系统的装置,其包括选择元件、比较元件和处理元件。所述选择元件可以被配置以便基于与音素的输入序列相关联的语音处理的类型来选择音素图。所述比较元件可以被配置以便将所述音素的输入序列与所选择的音素图相比较。所述处理元件可以与所述比较元件进行通信,并且可以被配置以便基于该比较来处理所述音素的输入序列。
- 话音及文本通信系统、方法及设备-200780028278.8
- 斯蒂芬·莫洛伊;哈利德·希勒米·埃尔-马勒赫 - 高通股份有限公司
- 2007-07-31 - 2009-07-29 - G10L13/04
- 本发明涉及用以将语音转换成文本及将文本转换成语音的系统、方法及设备。一种设备包括声码器、语音到文本转换引擎、文本到语音转换引擎及用户界面。所述声码器可操作以将语音信号转换成包及将包转换成语音信号。所述语音到文本转换引擎可操作以将语音转换成文本。所述文本到语音转换引擎可操作以将文本转换成语音。所述用户界面可操作以接收用户从多个模式中对一模式的选择,其中第一模式启用所述语音到文本转换引擎,第二模式启用所述文本到语音转换引擎,且第三模式启用所述语音到文本转换引擎及所述文本到语音转换引擎。
- 语音合成装置及其方法-200680054679.6
- 西山修;森田真弘;笼岛岳彦 - 株式会社东芝
- 2006-10-19 - 2009-06-03 - G10L13/04
- 一种语音合成装置,包括:从外部获取用于语音合成的文本数据的文本获取装置;对文本数据执行形态分析/解析的语言处理器;根据文本数据的与韵律和语言有关的属性,诸如重音和词性,向语音合成器输出合成单元串的韵律处理器;根据合成单元串产生合成语音的语音合成器;以及在输出合成语音被积累后或者在其被输出时顺序地再现规定量的输出合成语音的语音波形输出装置。
- 提供特征变换的有效评估的方法、装置、移动终端以及计算机程序产品-200780015664.3
- J·田;J·K·尼尔米南;V·波帕 - 诺基亚公司
- 2007-03-09 - 2009-05-13 - G10L13/04
- 一种用于提供特征变换的有效评估的装置,包括训练模块和变换模块。训练模块被配置为使用训练源数据和训练目标数据来训练高斯混合模型(GMM)。变换模块与训练模块通信。变换模块被配置为响应于对GMM的训练而产生转换函数。训练模块进一步被配置为通过计算GMM的迹测量,在使用转换函数之前确定转换函数的质量。
- 语音处理装置及语音处理方法-200810179911.X
- 平林刚;徐大威;笼岛岳彦 - 株式会社东芝
- 2008-10-31 - 2009-05-06 - G10L13/04
- 本发明涉及语音处理装置及语音处理方法。语音处理装置被配置为将第一语音波形和第二语音波形分别分割为多个频带以产生作为每一频带分量的第一带语音波形和第二带语音波形;确定每一频带的第一带语音波形和第二带语音波形之间的交叠相加位置以获得第一带语音波形和第二带语音波形之间的高互相关;并且以该交叠相加位置为基础,交叠相加每一频带的第一带语音波形和第二带语音波形并且在所有的多个频带上集成该多个频带的交叠相加带语音波形以产生拼接语音波形。
- 自动分割单字语音信号的装置与方法-200810232545.X
- 陈淮琰;韩召宁;杨亚冬 - 无敌科技(西安)有限公司
- 2008-12-02 - 2009-04-29 - G10L13/04
- 本发明涉及一种自动分割单字语音信号的装置与方法,该装置包含接收模块,用来接收单字语音信号,并将单字语音信号划分为多个音框;分析模块,分析音框,产生对应于每一个音框的语音特征;分割模块,根据语音特征,分割单字语音信号为音节,接收模块接入分析模块,分析模块接入分割模块,本发明完全替代了传统的人工切分单字语音的方式,整个过程不需要人工介入,省时省力,效率高,且大大降低了人为带来的失误率。
- 专利分类