[发明专利]一种分布式图像索引与检索方法有效

专利信息
申请号: 201510657308.8 申请日: 2015-10-12
公开(公告)号: CN105205169B 公开(公告)日: 2018-06-15
发明(设计)人: 郭乔进;胡杰;周鹏飞;梁中岩;陈文明;孟剑萍 申请(专利权)人: 中国电子科技集团公司第二十八研究所
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 江苏圣典律师事务所 32237 代理人: 胡建华
地址: 210007 江苏省南京*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出了一种分布式图像索引与检索方法,包括:搭建Hadoop分布式系统集群,包括HDFS分布式文件系统、YARN资源管理器、ZooKeeper分布式应用程序协调服务、Spark集群计算环境和HBase数据库;部署配置基于YARN资源管理器的Spark集群;启动图像索引流处理任务;启动图像检索流处理任务;图像索引流处理任务接收外部输入图像并建立索引;图像检索流处理任务接收待检索图像,输出检索到的相似图像。本发明采用了基于内存计算的Spark Streaming技术,能够实现图像处理任务和特征提取任务的分布式快速计算,具有高度的实时性。 1
搜索关键词: 流处理 检索 分布式图像 资源管理器 任务接收 图像检索 图像索引 集群 索引 分布式文件系统 分布式应用程序 集群计算环境 分布式系统 检索图像 建立索引 快速计算 内存计算 输入图像 特征提取 图像处理 相似图像 实时性 数据库 输出 外部 配置 部署 协调 服务
【主权项】:
1.一种分布式图像索引与检索方法,其特征在于,包括以下步骤:

步骤1,搭建Hadoop分布式系统集群,包括HDFS分布式文件系统、YARN资源管理器、ZooKeeper分布式应用程序协调服务、Spark集群和HBase数据库;

步骤2,部署配置基于资源管理器YARN的Spark集群;

步骤3,启动图像索引流处理任务;

步骤4,启动图像检索流处理任务;

步骤5,图像索引流处理任务接收外部输入图像序列并建立索引;

步骤6,图像检索流处理任务接收待检索图像,输出检索到的相似图像;

步骤1中,所述YARN资源管理器用于任务调度,负责集群计算资源的管理及为每个任务分配资源,所述HBase数据库用于存储图像;

步骤2包括:在Hadoop分布式系统集群上部署Spark集群,利用YARN资源管理器调度Spark集群的Spark任务容器,Hadoop分布式系统集群中的工作节点包括索引节点、检索节点、以及输出节点;

其中,索引节点负责对输入的图像提取特征,并保存到指定的HBase数据库表中,供后续检索使用;

检索节点,负责对输入的待检索图像计算其与指定HBase数据库表中所存储图像的相似度,并进行排序和输出;

输出节点负责对所有检索节点返回的结果进行归并排序,并从HBase数据库中读取图像编码,然后生成原始图像,再将检索到的图像返回给用户;

步骤3包括:在ZooKeeper分布式应用程序协调服务中建立N个索引表Ti,i=1,…,N,应用Spark流处理技术在Spark集群中建立N个索引节点Si,并为每个索引节点分配一个空闲的索引表,当一个索引节点失效时,ZooKeeper分布式应用程序协调服务中对应的索引节点和索引表分配节点自动删除,由Spark流处理技术自动新建索引节点,并在ZooKeeper分布式应用程序协调服务中重新建立对应索引节点及索引表分配节点;

步骤4包括:Spark流处理技术在Spark集群中建立N个检索节点Ri,i=1,…,N,并为每个检索节点分配一个空闲的索引表,当一个检索节点失效时,ZooKeeper分布式应用程序协调服务中对应的检索节点和索引表分配节点自动删除,由Spark流处理技术自动新建检索节点,并在ZooKeeper分布式应用程序协调服务中重新建立对应检索节点及索引表分配节点;

步骤5包括:对用户输入的图像序列,首先对每个图像I进行BASE64编码得到编码结果B并将编码后的字符串作为输入分发到已启动的索引节点Si,并从ZooKeeper分布式应用程序协调服务中获取该索引节点对应的索引表Ti,然后利用MD5编码对输入的图像编码计算图像的键值K,同时对编码结果B进行解码,并对解码后的图像提取视觉特征向量X,然后将[K,X,B]保存到索引表T中;

步骤6包括:对用户输入的待检索图像,首先对该图像进行BASE64编码得到编码结果B,并将编码后的字符串作为输入分发到已启动的检索节点Ri,并从ZooKeeper分布式应用程序协调服务中获取该索引节点对应的索引表Tu,u∈[1,N],然后对编码结果B进行解码,并对解码后的图像提取视觉特征向量X,然后计算其与索引表Tu中保存的图像特征的相似度σ,并进行排序,将排序后的前M组结果Wi={<K,σ,Tu>d|d=1,…,M}发送到输出节点,其中d为排序的序号,输出节点对接收到的检索结果Wi进行归并排序,保留前M组结果,并根据键值K及其对应的索引表Tu读取图像编码结果B,解码生成图像文件并返回图像路径。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第二十八研究所,未经中国电子科技集团公司第二十八研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510657308.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top