本发明公开了一种基于大数据的公路桥梁信息抽取方法,采用字、词嵌入方式作为桥梁文本信息的向量输入,并且,考虑桥梁文本存在时序关联性采用双向长短期记忆网络提取桥梁文本的时序特征;考虑到字、词所处文本位置的不同与词性也有一定的关系,本发明额外对位置嵌入进行了特征提取,并选择了提取空间特性效果更好的卷积神经网络提取空间特征;还采用Attention层对时序特征及空间特征进行权重分配及特征融合得到融合特征;从而达到更好的特征提取效果。本发明还公开了一种基于大数据的公路桥梁信息管理养护系统,提出了以领域知识图谱为核心的大数据知识工程层次化模型,为计算机科学、桥梁工程等学科交叉研究提供了新的场景。
1.一种基于大数据的公路桥梁信息抽取方法,其特征在于,包括:S1、获取目标桥梁文本,将所述目标桥梁文本输入信息抽取模型,所述信息抽取模型包括Lattice BiLSTM层、Position CNN层、Attention层,还包括字符序列标注层或关系预测层;Lattice BiLSTM层及Position CNN层采用双向并联的方式相连;S2、Lattice BiLSTM层基于所述目标桥梁文本生成对应的字嵌入及词嵌入,再基于字嵌入及词嵌入提取所述目标桥梁文本的时序特征;其中,给定一个长度为n的桥梁文本X={x1,x2,...,xn},对应的字嵌入为C={c1,c2,...,cn},词嵌入以位置信息作为开始和结束的标志,即每个词表示形式为以文本的嵌入式表示作为BiLSTM的输入,网络在t时刻的状态与t-1时刻和t+1时刻都相关;S3、Position CNN层基于所述目标桥梁文本生成对应的字位置嵌入、词位置嵌入及词性嵌入,再基于字位置嵌入、词位置嵌入及词性嵌入提取所述目标桥梁文本的空间特征;以字位置嵌入、词位置嵌入和词性嵌入作为输入,即其中,表示字位置嵌入,表示词位置嵌入,表示词性嵌入,输出为:S4、Attention层对时序特征及空间特征进行权重分配及特征融合得到融合特征;其中,将BiLSTM和CNN各自Attention处理后的结果再进行加权作为最终输出,即:S5、字符序列标注层或关系预测层对融合特征进行字符序列标注或关系预测。
本文链接:http://www.vipzhuanli.com/tech/sell/s_2311082.html,转载请声明来源钻瓜专利网。