[发明专利]图像中通用对象检测在审
申请号: | 201480071490.2 | 申请日: | 2014-10-09 |
公开(公告)号: | CN106462940A | 公开(公告)日: | 2017-02-22 |
发明(设计)人: | K·何;J·孙;X·张 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06T1/40 | 分类号: | G06T1/40 |
代理公司: | 上海专利商标事务所有限公司31100 | 代理人: | 胡利鸣 |
地址: | 暂无信息 | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 用于图像中对象检测的神经网络与空间金字塔池化(SPP)层一起被使用。使用所述SPP网络结构,不管图像大小与比例如何都生成固定长度表示。从整个图像计算一次特征图,并且特征可在任意区域(子图像)中被池化以便生成用于训练检测器的固定长度表示。从而,避免卷积特征的重复计算,同时准确性得到提高。 | ||
搜索关键词: | 图像 通用 对象 检测 | ||
【主权项】:
一种执行图像中对象检测的方法,所述方法包括:接收输入图像;由处理所述输入图像的神经网络的卷积层上的一个或多个滤波器生成特征图;在空间金字塔池化(SPP)层处对每个滤波器的响应进行空间池化;将所述SPP层的输出作为固定维度向量提供给全连接层;以及基于在所述全连接层处所接收到的所述固定维度向量来训练分类器以便检测所述输入图像中的一个或多个对象。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201480071490.2/,转载请声明来源钻瓜专利网。
- 上一篇:可缩放GPU中的数据分布组构
- 下一篇:GPU中的共享寄存器的加载方案
- 同类专利
- 一种基于卷积神经网络的太阳能电池板缺陷识别方法-201810250676.4
- 周颖;葛延腾;毛立;张燕;裘之亮;王彤 - 河北工业大学
- 2018-03-26 - 2019-08-09 - G06T1/40
- 本发明涉及一种基于卷积神经网络的太阳能电池板缺陷识别方法,包括模型离线训练和在线检测两个阶段,将卷积神经网络模型应用于太阳能电池板的缺陷识别上,使用2个CNN模型递进地实现了缺陷检测和分类。首先使用CNN二分类模型区分合格与缺陷图像,然后使用CNN多分类模型,对二分类模型判定为缺陷的图像进行分类。CNN模型对电池板的各种缺陷类型,都是采用相同的处理流程,即通过迭代训练,快速而自动进行特征提取和特征分类。对于新缺陷类型,只需收集该缺陷类型的样本数据,添加到训练用的数据集中并对模型进行训练,就能够实现该缺陷类型的检测。能够以较高的准确率快速识别出存在缺陷的小电池板的位置,并对多种缺陷进行类别判定,适用性更广。
- 工业设备图像识别处理器及控制器-201780078312.6
- 足立胜 - 株式会社安川电机
- 2017-10-12 - 2019-08-02 - G06T1/40
- 问题:提高图像识别处理的实际适用性。解决方案:提供图像识别处理器(11),其集成电路实现以下功能:存储已经基于先前学习确定的图像数据处理算法;获取包括预定图案的图像的图像数据;基于该算法对图像数据进行识别处理;和输出用于标识所识别的图案的标识信息。标识信息的输出由已经学习了预定图案与类型之间的对应关系的神经网络来处理,并且神经网络从预先准备的多种类型的图案中选择性地分类和输出。在图像中检测所识别的图案的位置区域,并且对图像数据进行处理并在图像中输出。
- 基于神经网络算法的处理视频图像的方法和装置-201610252056.5
- 费旭东 - 华为技术有限公司
- 2016-04-21 - 2019-03-05 - G06T1/40
- 本申请提出了一种基于神经网络算法的处理视频图像的方法,包括:确定视频图像中的当前帧的原始图像数据和前一帧的图像数据;对所述当前帧的原始图像数据和所述前一帧的图像数据进行差分运算得到差分数据,所述差分数据表示当前帧图像相对于前一帧图像的变化程度;根据所述差分数据确定第一图像数据,所述第一图像数据的数据量少于所述当前帧的原始图像数据的数据量;根据所述神经网络算法,对所述第一图像数据进行线性处理和非线性处理。因此,本发明实施例的处理视频图像的方法,通过在利用神经网络算法进行视频图像处理的过程中对每相邻两帧之间的数据进行差分处理,使得被处理的图像中的数据量减少,从而高效地完成视频图像输出。
- 用于多类别物体检测的方法和系统-201480081846.0
- 汤晓鸥;欧阳万里;曾星宇;邱石;吕健勤;王晓刚 - 北京市商汤科技开发有限公司
- 2014-09-10 - 2018-12-28 - G06T1/40
- 公开一种用于训练多类别物体检测的神经网络的装置。该装置可包括特征学习单元和子框检测器单元。根据本申请的一个实施例,特征学习单元被配置成:基于第一训练图像集的训练图像来确定第一神经网络,其中每个图像中有多个边界框,边界框的内部具有物体,并且所确定的第一神经网络给出输入图像的上下文信息;以及基于第一训练图像集中的图像的边界框来确定第二神经网络,随后基于第二训练集中的图像的边界框来进一步微调第二神经网络。子框检测器单元被配置成基于第二神经网络来确定用于边界框的子框检测器得分,子框检测器的每个预测得分用于一个边界框的一个语义物体类别的一个值。
- 基于多图形处理器的模型并行处理方法及装置-201410281130.7
- 邹永强;李毅;金涬;肖斌;郭志懋;薛伟;陈波;李勇;肖磊 - 深圳市腾讯计算机系统有限公司
- 2014-06-20 - 2018-12-11 - G06T1/40
- 本发明涉及一种基于多图形处理器(GPU)的并行数据处理方法,包括以下步骤:在中央处理器(CPU)内创建用于分别控制多个工作组(Worker Group)的多个工作线程(Worker),所述工作组包括多个GPU;将每个工作线程与对应的一个GPU绑定;从非易失性存储器内加载一个批次(Batch)的训练数据至与一个工作组对应的一个GPU显存中;在对应于一个工作组的多个GPU之间以点对点(Peer to Peer)的方式传输GPU进行数据处理所需要的数据;通过所述工作线程控制所述多个GPU并行进行数据处理。所述方法可以提升多GPU并行数据处理的效率。此外,本发明还提供一种并行数据处理装置。
- 对于神经网络计算操作的动态精度-201810372891.1
- S.雅哈吉达尔;A.科克;T.斯派斯曼;V.兰加纳坦;M.麦克弗森;B.温布;J.雷;R.巴里克;姚安邦;L.赫德;J.维斯特;A.阿普;D.金;F.陈;N.R.萨蒂什;N.G.冯博里斯;P.唐;T-H.林;X.陈;F.阿克巴里;K.辛哈;E.努尔维塔迪;N.斯利尼瓦萨;M.斯特里克兰 - 英特尔公司
- 2018-04-24 - 2018-11-02 - G06T1/40
- 在示例中,一种设备包括:计算引擎,包含高精度部件和低精度部件;以及至少部分包括硬件逻辑的逻辑,用于在所述计算引擎中接收指令、选择所述高精度部件或者所述低精度部件中的至少一个来执行所述指令、以及将门控应用于所述高精度部件或者所述低精度部件中的至少一个以执行所述指令。还公开并且要求保护其他实施例。
- 视觉神经电路装置及利用视觉神经电路装置的视觉神经模仿系统-201380017401.1
- 韩日成;韩佑俊 - 韩国科学技术院
- 2013-01-24 - 2017-09-29 - G06T1/40
- 本发明提供视觉神经电路装置,包括电流镜(Current Mirror)部,将晶体管用作电流源生成与反应相同大小的电流;跨导部,得到在电流镜部生成的电流的输入并利用跨导(Transconductance)输出电压;及缓冲器部,将跨导部输出的电压变换为电流进行缓冲。
- 图像中通用对象检测-201480071490.2
- K·何;J·孙;X·张 - 微软技术许可有限责任公司
- 2014-10-09 - 2017-02-22 - G06T1/40
- 用于图像中对象检测的神经网络与空间金字塔池化(SPP)层一起被使用。使用所述SPP网络结构,不管图像大小与比例如何都生成固定长度表示。从整个图像计算一次特征图,并且特征可在任意区域(子图像)中被池化以便生成用于训练检测器的固定长度表示。从而,避免卷积特征的重复计算,同时准确性得到提高。
- 一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法-201410062329.0
- 杨淑媛;焦李成;靳红红;刘红英;刘芳;马晶晶;张向荣;杨丽霞;侯彪;王爽;乔宇 - 西安电子科技大学
- 2014-02-24 - 2017-01-04 - G06T1/40
- 本发明属于机器学习技术领域,可用于高光谱地物分类,具体公开了一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法,主要解决了高光谱地物分类中由于标记样本少,混合像元现象,地物识别正确率不高等问题。其步骤为:首先对样本进行预处理,并把样本分为训练样本与测试样本;其次计算出训练样本的图Laplacian矩阵;再次随机的产生网络的输入权值与隐藏层偏置,利用标记样本计算网络输出权值的初始值;然后交替计算每个未标记样本属于每类的概率与网络的输出权值矩阵,直到目标函数相邻两次的差值在容许误差内;最后利用优化的模型预测测试样本标签。本方法具有较强实用性与鲁棒性,实验结果说明该发明很适合高光谱地物分类。
- 细胞单元的电路及神经细胞网络-201610203007.2
- 黄继攀;郭纪家;王新安;周生明;孙亚春;陈红英 - 北京大学深圳研究生院;深圳集成电路设计产业化基地管理中心
- 2016-04-01 - 2016-07-20 - G06T1/40
- 本申请公开了一种细胞单元的电路及细胞神经网络,包括:独立电压源;金属氧化物阻变器件;电容,其与所述金属氧化物阻变器件并联;至少一个压控电流源,其与所述金属氧化物阻变器件并联,其中所述压控电流源的一端接地,另一端接收周围细胞单元的所述压控电压源反馈电压;独立电流源,其与所述金属氧化物阻变器件并联,用于提供偏置电流;及压控电压源输出电压源,所述输出电压源的用于向所述周围细胞单元的所述压控电流源提供反馈电压。本申请还公开了一种细胞神经网络,其包括上述的细胞单元的电路。本申请公开的细胞单元的电路及细胞神经网络,能够实现在不重建网络的前提下实现神经网络权值的更新,从而实现多用功能。
- 专利分类
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序