[发明专利]一种视频场景分割判断方法、智能终端及存储介质有效
申请号: | 201711466018.0 | 申请日: | 2017-12-28 |
公开(公告)号: | CN109977738B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 陈铭良;吴佳飞;赖长明;徐永泽;杨福军 | 申请(专利权)人: | 深圳TCL新技术有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/77;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 王永文;刘文求 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 场景 分割 判断 方法 智能 终端 存储 介质 | ||
1.一种视频场景分割判断方法,其特征在于,所述视频场景分割判断方法包括:
采用深度学习网络对两个图像从多个维度进行特征提取;
将提取到的所述特征进行级联,拼接形成一个固定长度的深度级联特征向量;
判断所述深度级联特征向量的相似性,根据相似性的结果判断是否出现视频场景分割判断;
所述采用深度学习网络对两个图像从多个维度进行特征提取具体包括:
对于两个图像中的任意一图像,通过所述图像的灰度图获取灰度统计直方图;
通过边缘检测算子获取所述图像的边缘信息图;
根据原图像、边缘信息图和灰度统计直方图,采用三个卷积神经网络提取深度特征,输出4096维、2048维和1024维的特征向量;
通过卷积神经网络根据原图像、边缘信息图和灰度统计直方图提取特征向量前,预先完成卷积神经网络训练,所述训练包括:
单独训练阶段,将三个卷积神经网络完全拆开独立训练提取特征,第一组训练采用原图用第一训练模型提取特征,第二组训练用边缘信息图和第二训练模型提取特征,第三组训练用灰度统计直方图和第三训练模型提取特征,三种训练提取出来的特征分别通过自连接,和另一图像提取的特征连接,全卷积和分类器进行分类,训练出稳定的第一训练模型、第二训练模型和第三训练模型的参数来对特征进行提取;
两两配对训练阶段,将三个卷积神经网络两两配对训练提取特征,在单独训练阶段得到的参数上进一步调整,控制结合两个训练模型提取的特征互相级联拼接;
完整训练阶段,在默认训练模型的参数稳定的基础上进行,将训练模型的学习率调整到最小值,训练目标为全卷积层的参数,两个图像的三组特征向量拼接后全卷积输出2048维度的向量,以及最后分类器分成两类的参数;
通过三个阶段进行训练,得到稳定的深度级联特征提取模型和基于深度级联特征来判断场景分割的分类器。
2.根据权利要求1所述的视频场景分割判断方法,其特征在于,所述将提取到的所述特征进行级联,拼接形成一个固定长度的深度级联特征向量具体包括:
将提取到的4096维、2048维和1024维的三组级联的特征向量进行拼接,输出一个7168维的特征向量;
所述7168维的特征向量为一个固定长度的深度级联特征向量。
3.根据权利要求2所述的视频场景分割判断方法,其特征在于,所述判断所述深度级联特征向量的相似性,根据相似性的结果进行视频分割具体包括:
当得到两个图像的7168维的特征向量后,将两个图像的7168维的特征向量进行拼接;
当拼接完成后,全卷积输出最后的2048维的特征向量,通过分类器进行二分类判断两个图像的相似性;
当结果为1时则两个图像为同一个场景,否则结果为0时则判断出现视频场景分割判断。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳TCL新技术有限公司,未经深圳TCL新技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711466018.0/1.html,转载请声明来源钻瓜专利网。