[发明专利]流式自然语言信息的断句装置及方法有效
申请号: | 201810218878.0 | 申请日: | 2018-03-16 |
公开(公告)号: | CN108549628B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 王星光 | 申请(专利权)人: | 云知声智能科技股份有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G10L15/26 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种流式自然语言信息的断句装置及方法,其中,所述装置包括:语音识别模块,用于按照指定频率输出带有时序的语音识别结果;信息流聚合模块,用于形成语音识别结果序列;动态窗口设定模块,用于选择指定范围的文本;断句识别模块,用于根据分析得到的语义确定所述指定范围的文本中的分割点;句子注册模块,用于将分割得到的多个断句注册至时间轴上,并基于当前注册的断句,对之前注册过的断句进行修正;句子输出模块,用于输出未曾注册过的断句以及经过修正的断句。本发明提供的技术方案,能够提高断句的准确性,并且可以实现断句修正能力。 | ||
搜索关键词: | 自然语言 信息 断句 装置 方法 | ||
【主权项】:
1.一种流式自然语言信息的断句装置,其特征在于,所述装置包括:语音识别模块、信息流聚合模块、动态窗口设定模块、断句识别模块、句子注册模块以及句子输出模块,其中:所述语音识别模块,用于接收并识别语音实时流,并按照指定频率输出带有时序的语音识别结果;所述信息流聚合模块,用于对所述带有时序的语音识别结果进行优化处理,并整合经过优化处理后的带有时序的语音识别结果,以形成语音识别结果序列;所述动态窗口设定模块,用于从所述语音识别结果序列中选择指定范围的文本,所述指定范围的文本用于进行断句分析;所述断句识别模块,用于分析所述指定范围的文本的语义,并根据分析得到的语义确定所述指定范围的文本中的分割点,所述分割点用于将所述指定范围的文本划分为多个断句;所述句子注册模块,用于将分割得到的多个断句注册至时间轴上,并基于当前注册的断句,对之前注册过的断句进行修正;所述句子输出模块,用于输出未曾注册过的断句以及经过修正的断句。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司,未经云知声智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810218878.0/,转载请声明来源钻瓜专利网。
- 上一篇:汉字处理方法及装置
- 下一篇:一种结合相似度和图匹配的老-汉双语句子对齐方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置