本发明公开了一种基于规则的Spark分布式弹性语义流推理方法,包括:S1、获取RDF图;S2、为RDF图的标识符构建双向字典;S3、对RDF图进行划分得到模式图模型和实例图模型;S4、利用双向字典基于模式图模型和实例图模型设计对应的键值模型;S5、基于规则的Spark分布式弹性语义流推理引擎模块读取模式图模型和实例图模型中的模式数据和实例数据,根据RDFS规则的优化顺序执行Spark作业。与现有技术相比,本发明采用分布式内存计算模型Spark,把面向分布式数据集的操作抽象成面向本地数据集的操作,进一步提高了大数据处理环境下迭代计算的效率,并且实现了分布式的内存RDFS推理,有助于进一步提升RDFS推理效率和可扩展性。
1.一种基于规则的Spark分布式弹性语义流推理方法,其特征在于,包括:S1、获取RDF图;S2、为RDF图的标识符构建双向字典;S3、对RDF图进行划分得到模式图模型和实例图模型;S4、利用双向字典基于模式图模型和实例图模型设计对应的键值模型;S5、基于规则的Spark分布式弹性语义流推理引擎模块读取模式图模型和实例图模型中的模式数据和实例数据,根据RDFS规则的优化顺序执行Spark作业;步骤S4包括:S401、对于Vs中每一个RDF类节点v,设计一个类键值模型CR=v,(subv,parv),v为CR的键,subv表示v的子类列表,parv表示v的超类列表;S402、对于Vs中的每一个RDF属性节点p,设计一个属性键值模型PR=p,(subp,parp,dom,rag),p为PR的键,subp表示p的子属性列表,parp表示p的超属性列表,dom表示p对应的域,rag表示p对应的范围;S403、对于Vi中的每个实例节点v,构造一个实例键值模型IR=(C,v),(InList,OutList),(C,v)表示IR的键部分,(InList,OutList)表示IR的值部分;步骤S5包括:S501、从模式数据和实例数据中基于RDFS语义,列出RDFS规则,并优化规则推理顺序;S502、利用Spark分布式弹性语义流推理引擎实现分布式弹性语义流推理。
本文链接:http://www.vipzhuanli.com/tech/sell/s_2311309.html,转载请声明来源钻瓜专利网。