[发明专利]基于全局知识挖掘和前景注意力的交互视频动作检测方法有效

申请号：	202210636564.9	申请日：	2022-06-07
公开（公告）号：	CN114998799B	公开（公告）日：	2023-01-13
发明（设计）人：	高赞;崔兴磊;陶俊伟;宋健明;王水跟;朱文印;张蕊	申请（专利权）人：	山东省人工智能研究院;青岛海尔智能技术研发有限公司;烟台艾睿光电科技有限公司;苏州天瞳威视电子科技有限公司
主分类号：	G06V20/40	分类号：	G06V20/40;G06V40/20;G06V20/50;G06V10/764;G06V10/774;G06V10/80;G06V10/82;G06V10/40;G06N3/04
代理公司：	山东知圣律师事务所 37262	代理人：	丁奎英
地址：	250000 山***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于全局知识挖掘和前景注意力的交互视频动作检测方法，准确地实现了对视频中动作实例的定位和分类；方法的具体步骤如下：对视频进行预处理，通过I3D网络将生成的视频帧获得时空特征序列，将特征序列输入到上下文信息提取模块提取不同层次的特征序列F，通过时间信息提取模块挖掘视频的全局信息，将特征序列F和特征序列连接起来，得到粗时间边界和粗分类，根据不同层次的特征结合损失函数利用前景信息增强模块得到精细化特征；本发明基于已知数据集对视频中的动作实例进行高效定位和分类，并且方法收敛速度快。
搜索关键词：	基于全局知识挖掘前景注意力交互视频动作检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于山东省人工智能研究院;青岛海尔智能技术研发有限公司;烟台艾睿光电科技有限公司;苏州天瞳威视电子科技有限公司，未经山东省人工智能研究院;青岛海尔智能技术研发有限公司;烟台艾睿光电科技有限公司;苏州天瞳威视电子科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202210636564.9/，转载请声明来源钻瓜专利网。

上一篇：改进的增压组合物
下一篇：一种半监督学习下的城市颗粒物浓度时空预测方法

同类专利

基于计算机视觉和智能算法的车重检测方法及视频采集系统-202310857402.2
发明人：王浩祺;刘沐坤;刘怡欣;夏楠歆 -专利权人：同济大学
申请日： 2023-07-13 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本发明提出一种基于计算机视觉和智能算法的车重检测方法及视频采集系统，本发明基于减速带和摄像头等装置大量采集各种车型在一定速度区间内通过特定减速带的视频；通过采集待测车辆通过减速带的车尾部震动视频，得到振动轨迹和周期；并且建立数值仿真模型；根据实际追踪的所述振动轨迹和所述数值仿真模型的振动响应，基于遗传算法匹配待测车辆半车模型结构参数最优解，并与同车型空载状态的车重对比，得到待测车重，本发明实现了非接触式车重检测，从而有效判断车辆超载情况、同时具有测重速度快、精度高、成本低、适应性广等特点。

端侧分层神经网络模型训练方法、装置、计算机设备-202310745026.8
发明人：廖丽平;林俊龙;蔡君 -专利权人：广东技术师范大学
申请日： 2023-06-21 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本发明属于计算机技术领域，涉及端侧分层神经网络模型训练方法、装置、计算机设备及存储介质，所述方法包括获取神经网络；对所述神经网络的卷积层进行改进，降低卷积层特征图冗余，得到改进后的卷积层；对所述神经网络模型进行模型动态切分，得到模型动态切分切分点；根据改进后的所述卷积层和所述模型动态切分切分点，基于分布式机器学习，设计分层训练架构。在保证模型一定准确率的条件下，对模型进行改进和切分，使得模型在单个设备上训练的计算量降低，实现神经网络模型在端侧部署的目的，解决端侧模型训练中存在的模型计算量大、单个设备数据量少的问题，并且降低时延和提高传输安全，促进端侧算力资源的合理利用。

面向乒乓球比赛视频的多任务数据实时检测方法和装置-202310733836.1
发明人：巫英才;邓达臻;袁泽清;何宇辰 -专利权人：浙江大学
申请日： 2023-06-20 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本发明公开了一种面向乒乓球比赛视频的多任务数据实时检测方法和装置，包括以下步骤：构建多任务数据实时检测模型，包括视频特征提取模块、球检测模块和击球动作识别模块；对模型进行无监督预训练和有监督训练；利用训练好的视频特征提取模块中加入三维卷积层的深度神经网络提取逐帧视觉特征；利用训练好的球检测模块将逐帧视觉特征变为单通道置信度的热力图，确定球的逐帧位置；利用训练好的击球动作识别模块将逐帧视觉特征降维并编码，再次降维后通过线性回归得到逐帧球员击球置信度，确定击球时刻和击球次数；将模型输出结果进行可视化处理，标注在乒乓球比赛视频中，实现球检测和击球动作识别的多任务数据可视化实时检测。

一种线路工程智慧工地施工物料使用关联方法、介质及系统-202310802026.7
发明人：刘一霖;易勇强;李宏斌;郑国强;高尚;李思隆;区健 -专利权人：南方电网互联网服务有限公司
申请日： 2023-06-30 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本发明涉及电网用电管理技术领域，尤其涉及一种线路工程智慧工地施工物料使用关联方法、计算机可读存储介质和智慧工程管理系统。在智慧工程管理系统中，对预设的调入时间段内调入施工现场并使用的施工物料，调取其在预设的使用时间段内的使用登记记录，从使用登记记录中读取施工物料的使用对象，然后识别所读取的使用对象，对施工现场图片库中在使用时间段内拍摄的进程图片，用所识别的使用对象的特征对各个进程图片的画面内容进行特征匹配，以查找画面内容具有该使用对象的进程图片，对该进程图片进行显示，使得管理者能够清晰地查看到施工物料在施工现场的使用效果。

用于确定文本和视频之间的相似度的方法和装置-202310906058.1
发明人：蒋晨;刘洪;俞旭铮;郭清沛 -专利权人：支付宝（杭州）信息技术有限公司
申请日： 2023-07-21 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本说明书的实施例提供了一种用于确定文本和视频之间的相似度的方法和装置。在该用于确定文本和视频之间的相似度的方法中，将所获取的文本视频对包括的文本和视频分别提供给文本特征提取模型和视频特征提取模型，得到对应的词符特征序列和图像特征序列；根据各个词符特征与各个图像特征之间的相似度确定相关词符特征‑图像特征对；针对各个相关词符特征‑图像特征对，对该词符特征与该图像特征之间的相似度和所确定的该图像特征对应的相近图像特征与词符特征序列之间的相似度进行聚合，生成相近图像约束相似度；以及基于所得到的相近图像约束相似度，确定文本视频对中的文本和视频之间的相似度。

一种风险稽核方法、装置及设备-202310942616.X
发明人：郑丹丹;李旭;白海波;尹嘉晨 -专利权人：支付宝（杭州）信息技术有限公司
申请日： 2023-07-28 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本说明书实施例中公开了一种风险稽核方法、装置及设备。该方案可以包括：从商店处的大量视频数据中，先筛选出与商店内的目标用户相关的各个目标视频片段，然后确定出各个目标视频片段反映的目标用户针对商品的第一偷盗风险值，通过将第一偷盗风险值最大的前目标数量的目标视频片段作为待稽核视频片段提供给风险管理用户，从而能够获取到风险管理用户基于该待稽核视频片段反馈的针对目标用户的偷盗风险稽核结果。

一种针对类内多样性遮挡情况下的目标轨迹的跟踪方法-202310959600.X
发明人：岳峻;张逸飞;张君;马正;寇光杰;李振波;贾世祥;孙浩 -专利权人：鲁东大学
申请日： 2023-08-01 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本发明公开了一种针对类内多样性遮挡情况下的目标轨迹的跟踪方法，属于深度学习技术领域，包括以下步骤：采集水产养殖池中养殖目标的跟踪视频，进行标注和视频分帧后，生成存在类内多样性遮挡情况的待识别图片；通过1×1卷积进行特征提取并进行整合后，输入到融合空间注意力机制的跨尺度特征融合模块进行特征融合；对特征融合后的输出结果，采用养殖目标的运动位置信息对目标与轨迹进行数据关联匹配，生成养殖目标的目标轨迹；本发明在目标外观相似、姿态变频繁换及类内遮挡情况下，排除外观相似度的影响更有利于网络精确识别被遮挡的目标，从而生成更准确完整的轨迹。

封面图生成方法、装置、电子设备以及存储介质-202310285327.7
发明人：罗锦文;刘辉 -专利权人：北京搜狗科技发展有限公司
申请日： 2023-03-22 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本申请实施例公开封面图生成方法、装置、电子设备以及存储介质，该方法可以应用于人工智能领域。该方法自动在初始视频图中选取用于生成封面的初始封面图，对该初始封面图中不属于该目标视频所对应的原始视频的对象进行抹除，得到了不包含非主要内容的中间封面图。中间封面图相较于初始封面图，冗余信息和与原始视频无关的非主要内容被显著降低，从而提升了质量。并且，本申请实施例还可以根据初始封面图关联的语义信息进行摘要预测，得到目标摘要，并且将目标摘要以合理的布局叠加在中间封面图上，从而使得形成的目标封面图包含更容易被用户理解的文本信息，便于用户快速感知目标视频核心内容，提升封面表现力，从而提升目标视频的交互表现。

一种模型的训练方法、视频处理方法、装置、介质及设备-202310520054.X
发明人：张墨琪;邓伟辉;梁汉帮;李小成;傅德良;王震 -专利权人：北京字跳网络技术有限公司
申请日： 2023-05-09 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本公开实施例提供了一种模型的训练方法、视频处理方法、装置、介质及设备。其中训练方法包括：获取样本视频，对样本视频中的视频帧进行至少一种策略的处理，得到视频帧的至少一个处理图像；根据视频帧的至少一个处理图像确定所述视频帧的处理标签；基于样本视频和样本视频中视频帧的处理标签对待训练的视频处理模型进行迭代训练，得到训练好的视频处理模型。通过基于多个处理方式形成至少一种策略，对于样本视频中的每一视频帧，可通过多种策略对视频帧进行处理后，筛选得到适合于每一视频帧的处理标签。通过样本视频和样本视频中视频帧的处理标签可训练得到具有对视频中视频帧进行自适应处理功能的视频处理模型，以提高视频处理的准确性。

多维信息标注方法、装置、电子设备及存储介质-202310539512.4
发明人：刘康伟;张亚南;毛云翔;刘兰个川 -专利权人：广州小鹏自动驾驶科技有限公司
申请日： 2023-05-12 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本申请涉及多维信息标注方法、装置、电子设备及存储介质。该多维信息标注方法包括：在第一坐标系下获得包括特定对象的点云帧，并且在第二坐标系下获得包括特定对象的视频帧；基于点云帧获得特定对象的多维信息，并且获得特定对象的图像在视频帧中的位置范围信息；基于坐标系转换参数将第一坐标系下的多维信息转换至第二坐标系下，以利用第二坐标系下的多维信息标注与视频帧的位置范围信息对应的图像。本申请提供的方案，能够有效降低获得训练数据的人工成本和时间成本，并且能有效提升训练数据的标注信息的精准度。

路段图像的提供方法、装置、终端及存储介质-202310415001.1
发明人：杨文慧;肖伟思;张伟超;魏向男 -专利权人：腾讯科技（深圳）有限公司
申请日： 2023-04-11 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本申请公开了一种路段图像的提供方法、装置、终端及存储介质，涉及地图技术领域。所述方法包括：对规划采集轨迹所对应的至少一个路段进行场景图像采集，得到采集数据；根据采集数据，获取至少一个路段分别对应的采集车信集合；根据路口拓扑关系确定路段对应的关联路段集合；对路段对应的关联路段集合中各个关联路段分别对应的采集车信集合和历史车信集合进行比对，确定目标路段；将目标路段对应的图像帧发送至服务器。本申请可应用于人工智能、智慧交通、辅助驾驶等场景中，本申请根据路口拓扑关系确定目标路段，并仅将目标路段对应的图像帧发送至服务器，减少了服务器的工作量的同时，提高了路段图像的提供准确性。

基于深度神经网络的电缆附件安装工艺管控系统及方法-202310759302.6
发明人：李泰伟;杨宇平;尹林;刘沛轩;蔡礼;帅一;刘晓波;刘明军;黄巍;李秋德;涂睿;陈波;张晨晖;冷正旸;叶爱民;游闽;周海萍 -专利权人：国网江西省电力有限公司南昌供电分公司;国家电网有限公司
申请日： 2023-06-26 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本发明公开了基于深度神经网络的电缆附件安装工艺管控系统及方法，该系统包括电缆附件安装视频数据预处理模块、基于YOLOV8的DNN目标检测模块和有限状态机综合信息分析模块；通过电缆附件安装视频数据预处理模块将视频转化为视频帧输入基于YOLOV8的DNN目标检测模块提取特征图并且输出边界框、类别标签和置信度分数，在有限状态机综合信息分析模块中加入工作日志和时间模块通过计算工序处理时间和工序操作流程来判断工序是否合格。本发明使用基于YOLOV8的DNN目标检测模块与有限状态机综合信息分析模块可以对电缆附件安装工艺进行管控，提高电缆附件安装管控的效率和质量。

基于视频的高尔夫挥杆评测方法及系统-202310671046.5
发明人：张艳婷;涂福宇 -专利权人：东华大学
申请日： 2023-06-07 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本发明的一个技术方案是提供了一种基于视频的高尔夫挥杆评测方法，其特征在于，包括关键帧提取网络以及挥杆动作对比分析模块。本发明的另一个技术方案是提供了一种基于上述的高尔夫挥杆评测方法实现的高尔夫挥杆评测系统，其特征在于，分为展现层、通讯层、服务层和数据层，包括用户管理功能模块、视频管理功能模块和AI挥杆动作对比分析功能模块。本发明所需设备仅一部智能手机，根据挥杆关键事件对比分析挥杆动作，能够更迅速准确地定位动作的问题所在，且对骨架模型进行3D重建，可以多角度查看挥杆动作与职业球员的差异。同时能够提供量化数据分析，例如部分关节的角度，并能以与职业球员的骨骼点距离作为标准度评分。

视频与文本的匹配方法、装置、电子设备和存储介质-202211574887.6
发明人：闵少波;蒋杰;李志锋;刘威 -专利权人：腾讯科技（深圳）有限公司
申请日： 2022-12-08 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本申请涉及计算机技术领域，尤其涉及人工智能技术领域，提供一种视频与文本的匹配方法、装置、电子设备和存储介质。其中，方法包括：获取待匹配视频的图像特征，及待匹配文本的单词特征；将图像特征进行至少一次聚合处理，得到待匹配视频对应的视频特征，以及将单词特征进行至少一次聚合处理，得到待匹配文本对应的语句特征；分别将各图像特征与各单词特征进行两两匹配，获得待匹配视频与待匹配文本的第一层级相似度；以及，将视频特征与语句特征进行匹配，获得待匹配视频与待匹配文本的第二层级相似度；基于第一层级相似度与第二层级相似度，获得相应的匹配结果。由于本申请在多个层级对视频与文本特征进行匹配，提高了视频文本检索的准确度。

一种基于FairMOT的多目标追踪模型训练方法及系统-202310692867.7
发明人：徐雷 -专利权人：聚真宝（山东）技术有限公司
申请日： 2023-06-12 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本发明属于目标追踪技术领域，提供了一种基于FairMOT的多目标追踪模型训练方法及系统，包括：解析视频序列，对视频序列解析成图像帧集合并处理每一帧的标注，对标注的视频序列应用Pipeline数据增强流水线，对训练数据进行预处理与图像增强操作；基于可配置的参数文件方式搭建神经网络架构，使用YML文件配置FairMOT的网络模型；对CenterNET的特征提取网络进行优化和拓展；接受配置文件的设置初始化参数，创建模型训练圈流程以及需要的参数，对FairMOT模型进行训练，能够获取更好的图像特征在空间和语义上信息，减少网络的计算参数，提升模型性能，并保证模型损失的精度在一个可接受的范围。

店外经营识别方法、装置、计算机设备及存储介质-202311012605.8
发明人：刘子伟;王俊宜;姚钊盈;付森 -专利权人：武汉市万睿数字运营有限公司;深圳市万物云科技有限公司
申请日： 2023-08-11 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本发明公开了店外经营识别方法、装置、计算机设备及存储介质。该方法从店铺经营的视频流数据提取输入图像，利用目标检测算法对输入图像进行目标检测，得到包含物品检测框和店门检测框的输出图像；然后基于物品检测框和店门检测框的重叠区域，判断经营物品的位置，当检测出经营物品在店外时对输出图像进行深度估计；根据得到的深度图像、店门检测框和物品检测框判断经营物品是否超过店铺门限。本申请相比现有方法，有效提高店外经营的检查效率，降低相关部门巡检的工作量，大大节省经济成本。

目标追踪的方法和系统-202311198170.0
发明人：叶建云 -专利权人：杭州靖安防务科技有限公司
申请日： 2023-09-18 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本发明实施例公开了一种目标追踪的方法和系统。该系统包括：第一图像跟踪设备依据获取的目标车辆信息匹配第一目标对象，获取第一目标对象的行驶轨迹直至第一目标对象驶出，根据定位信息和路网信息计算第一目标对象的驶离方向，依据驶离方向在预设范围内从至少一个第二图像跟踪设备中选取第二图像跟踪设备，并将接力跟踪指令发送至选取的第二图像跟踪设备；至少一个第二图像跟踪设备接收接力跟踪指令，依据接力跟踪指令获取第一目标对象的车辆信息，依据车辆信息中的驶离方向确定第二目标对象与第一目标对象相同，并获取第二目标对象的行驶方向，依据行驶方向对第二目标对象进行追踪。本发明提供的方案能够提升追踪目标的效率的技术效果。

背景融合效果分析方法、装置、设备、介质及程序产品-202211521996.1
发明人：龚桂良;易高雄 -专利权人：腾讯科技（深圳）有限公司
申请日： 2022-11-30 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本申请公开了一种背景融合效果分析方法、装置、设备、介质及程序产品，涉及视觉技术领域。该方法包括：获取目标视频对应的视频帧集合，其中，视频帧集合中包括多帧顺序排列的视频帧，视频帧中包括目标对象，视频帧标注有参考融合结果；获取目标视频对应的背景融合结果；确定参考融合结果和背景融合结果的区域重叠结果；基于多帧视频帧分别对应的区域重叠结果以及多帧视频帧的排列顺序生成目标波谱图；基于目标波谱图对多帧视频帧的背景融合结果进行效果分析，得到效果分析结果。也即，通过根据目标对象在参考融合结果和背景融合结果中分别所处区域的重叠程度生成目标波谱图替代对背景融合结果的主观分析，提高背景融合效果分析的准确度和效率。

一种数据处理方法、装置、设备和计算机可读存储介质-202210844046.6
发明人：谢朗;龚国成;张玉栋;简鑫;康颖 -专利权人：中移物联网有限公司;中国移动通信集团有限公司
申请日： 2022-07-18 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本申请实施例公开了一种数据处理方法、装置、设备及计算机可读存储介质。该方法包括：获取视频文件对应的图像帧，对图像帧进行目标检测，获得目标检测结果；基于目标检测结果对检测对象进行跟踪处理，确定检测对象的运动轨迹信息；基于该运动轨迹信息确定运动过程中通过参考线段的目标对象；基于目标对象的运动轨迹信息和参考线段的位置信息确定目标对象通过参考线段时的运动方向，并进行数据统计，得到目标统计数据。如此，根据目标对象的运动轨迹和参考线段的位置信息确定目标对象通过参考线时的运动方向，并根据该运动方向进行计数，可以解决目标对象在参考线段附近来回移动而导致计数错误的问题，从而提高了目标对象的计数精度。

一种安全帽检测方法、系统、存储介质及电子设备-202311188907.0
发明人：宗涛;刘云川;周伟;易军;陈文鑫 -专利权人：四川泓宝润业工程技术有限公司;重庆泓宝科技股份有限公司
申请日： 2023-09-15 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本发明揭示了一种安全帽检测方法、系统、存储介质及电子设备，其方法包括：采集多路作业现场视频图像；对所采集的多路视频图像进行预处理，获得预处理后的视频图像；构建安全帽检测模型并训练，获得训练好的安全帽检测模型，其中，所述检测模型采取Focus层、逐深度卷积DWC3层、CBAM层以在较少的参数量的前提下降低对计算资源的需求；将预处理后的视频图像输入训练好的安全帽检测模型，以对视频图像中作业人员是否佩戴安全帽进行检测。本发明通过使用轻量化网络模型进行安全帽检测，降低了计算资源的需求，同时依然保障了检测精度和检测速率，可用于边缘计算。

一种基于云计算的体育场馆安防监测系统-202310913091.7
发明人：潘毅 -专利权人：岳阳职业技术学院
申请日： 2023-07-25 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本发明公开了一种基于云计算的体育场馆安防监测系统。该基于云计算的体育场馆安防监测系统，包括体育场馆安防监测设备、体育场馆安防监测终端和体育场馆安防云平台，且所述体育场馆安防云平台分别与体育场馆安防监测设备和体育场馆安防监测终端通过通信连接。本发明通过获取体育场馆安防监测视频并对视频进行分割得到图像，监测图像中各预约运动者的轮廓重心得到其运动轨迹从而判断是否有异常情况，若存在异常就发现提醒信息给安防监测终端进行判断处理，进而对体育场馆的锻炼人数、预约运动者的锻炼区域和锻炼行为的安全性进行数值化评价，达到了提高安防监测智能化的效果，解决了现有技术中存在安防监测智能化低的问题。

多媒体数据的处理方法、装置、设备及介质-202310931971.7
发明人：罗达志 -专利权人：腾讯科技（深圳）有限公司
申请日： 2023-07-26 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本申请提供了一种多媒体数据的处理方法、装置、设备及介质，该方法包括：在获取到第一全局特征时查找匹配的第二全局特征，将对应的第二多媒体本体作为待处理多媒体本体，基于第一多媒体本体和待处理多媒体本体构建多媒体数据对，将第一全局特征与查找到的第二全局特征的全局特征匹配度作为第一类型匹配度，确定第一关联多媒体信息和待处理多媒体信息的信息匹配度，将信息匹配度作为第二类型匹配度，基于第一类型匹配度和第二类型匹配度进行数据对匹配，得到数据对匹配度，基于数据对匹配度将与第一多媒体本体相匹配的待处理多媒体本体确定第一匹配多媒体本体。本申请可以提升多媒体本体相似匹配的准确度。

基于时空增强关联记忆的视频异常检测方法-202310950812.1
发明人：仲元红;胡永婷;祝如越;严格;孙树海;钟代笛;黄智勇;韩术;周庆 -专利权人：重庆大学
申请日： 2023-07-31 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本发明具体涉及基于时空增强关联记忆的视频异常检测方法，包括：将视频帧序列输入经过训练的异常检测模型输出对应的异常预测值；将训练视频帧序列及其光流序列输入异常检测模型；提取外观特征和运动特征；利用运动特征来对外观特征进行融合增强；基于融合特征进行关联检索，得到正常事件原型间的关系，进而调整融合特征的特征维度生成最终特征；对最终特征进行解码，得到对应的异常预测值；根据异常预测值和对应的异常真实值计算模型损失并优化模型参数，直至模型收敛。本发明通过记录和学习正常事件的原型及其原型关系来调整特征维度，并且能够利用运动特征来增强外观特征以实现时空语义增强，从而提高视频异常检测的性能的准确性。

视频火焰前景分割预处理方法、装置、设备及存储介质-202310960594.X
发明人：朱运平;唐杰;戴立言;伍爱群;韩佳 -专利权人：上海网达软件股份有限公司;上海航天信息科技有限公司;上海航天信息科技研究院
申请日： 2023-08-01 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本发明提供了一种视频火焰前景分割预处理方法、装置、设备及存储介质，包括：获取原始视频图像并进行预处理；基于混合高斯模型的聚类算法对预处理后的视频图像进行前景分割；将疑似火焰区域通过HIS颜色空间进行特征判断；对筛选后的火焰目标区域绘制检测框；根据所述火焰目标选框之间的距离选取相邻的火焰目标选框区域进行合并；在合并后的火焰目标选框区域具有重叠的情况下，对火焰目标选框区域进行融合；将融合后的火焰目标选框区域作为最终掩码图像，与原始视频图像做位与运算，在原始视频图像上分割出最终框选的火焰目标彩色图像，解决当前神经网络检测模型对于视频火焰检测场景中漏检，误检率高的问题，减少漏检误检的情况。

视频标题的生成方法、装置、设备、存储介质及程序产品-202310814210.3
发明人：乔凌峰 -专利权人：腾讯科技（深圳）有限公司
申请日： 2023-07-04 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本申请公开了一种视频标题的生成方法、装置、设备、存储介质及程序产品，涉及机器学习领域。该方法包括：获取第一视频，第一视频对应有视频帧序列和语音文本；通过标题生成模型中的动作预测网络对第一视频中的视频帧序列进行动作预测，得到至少一个动作预测标签，至少一个动作预测标签用于描述第一视频中的动作行为；通过标题生成模型中的标题预测网络对视频帧序列、语音文本和至少一个动作预测标签进行标题预测，得到视频预测标题，动作预测网络和标题预测网络是在标题生成模型的训练过程中共同训练的网络，通过加入动作预测标签指导标题生成模型生成视频预测标题，提高了对第一视频中多个事件的区分度，提升了标题生成质量。

一种视频特征提取方法、装置、可读存储介质及终端设备-202310917755.7
发明人：王侃;胡淑萍;庞建新;谭欢 -专利权人：深圳市优必选科技股份有限公司
申请日： 2023-07-24 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本申请属于目标识别技术领域，尤其涉及一种视频特征提取方法、装置、计算机可读存储介质及终端设备。所述方法包括：获取待处理的视频序列；对所述视频序列中的各个视频帧分别进行图像特征提取，得到所述各个视频帧的第一图像特征；根据所述各个视频帧的第一图像特征计算所述视频序列的第一视频特征；根据所述第一视频特征对所述各个视频帧的第一图像特征分别进行特征优化，得到所述各个视频帧的第二图像特征；根据所述各个视频帧的第二图像特征计算所述视频序列的第二视频特征。通过本申请，可以有效减弱质量较差的视频帧对于最终提取的视频特征的质量影响，提高视频特征提取的鲁棒性。

一种羽毛球运动的智能化辅助训练方法及系统-202310922353.6
发明人：韩梁俭;李雨恒;韩博 -专利权人：浙江大学
申请日： 2023-07-26 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本发明适用于人工智能计算机视觉应用领域，尤其涉及一种羽毛球运动的智能化辅助训练方法及系统，从二维球路检测与跟踪中输出球体的位置信息和时序信息，在三维空间中对其进行了还原和轨迹优化。实现了基于双目视角和单目视角的运动员技术动作获取方法。从时序、场地、比赛规则等多个角度引入额外条件约束，尝试为单目视角下的羽毛球运动员的三维人体姿态越策更准确的估计结果。实现了智能化辅助训练原型系统，在系统中对球路获取和运动员技术动作获取方案进行了整合集成，并且配套了对应的数据采集功能和数据存储、索引功能，形成了对数据采集、数据分析、数据存储与输出的羽毛球视频分析流程的闭环。

一种基于多光谱双目立体视觉的视频异常行为检测方法和系统-202310940861.7
发明人：陈燕;刘攀博;李祖贺;王凤琴;杨永双;王丽萍 -专利权人：郑州轻工业大学
申请日： 2023-07-28 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本发明公开了一种基于多光谱双目立体视觉的视频异常行为检测方法和系统，该方法包括基于空间坐标变换关系和图像配准模型，在多光谱平台下对双目视频进行视觉标定，根据标定结果实现图像背景建模，分割前景目标；针对分割后的目标，通过建立目标表观纹理模型、运动显著性模型和深度显著性模型来确定目标在全局和局部时空域中的各个光谱维显著性特征；将所有显著性特征在不同尺度下组成多尺度多模态特征融合模型，通过融合模型检测目标的异常行为。本发明提高了目标异常检测效率和检测准确性。

视频匹配方法、装置、电子设备及存储介质-202311088950.X
发明人：张杰;钟蕊;孙珊;周传淯;杨正;郝维聪;王智艺;刘睿博;焦磊;田甜 -专利权人：河北广电无线传媒股份有限公司
申请日： 2023-08-28 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本发明提供一种视频匹配方法、装置、电子设备及存储介质。该方法包括：获取短视频的标签信息；基于标签信息从指定的长视频库中查找与短视频匹配的目标长视频，并将目标长视频与短视频关联；获取第一终端对短视频的播放信息，若播放信息满足预设条件，则将目标长视频的播放链接推送至短视频的播放界面；接收第一终端发送的目标长视频的播放链接的点击信号，响应于点击信号，在与第一终端关联的第二终端上播放目标长视频。一方面本发明可以实现原创短视频与影视库中长视频之间的匹配，另一方面，在检测用户可能对匹配的长视频感兴趣时再进行长视频播放链接推送，提高了推送链接的被点击率，改善了用户体验。

口罩佩戴检测方法、装置、电子设备及存储介质-202211517534.2
发明人：胡碧昕 -专利权人：腾讯科技（深圳）有限公司
申请日： 2022-11-29 - 公布日： 2023-10-27 - 主分类号： G06V20/40
摘要：本申请公开了一种口罩佩戴检测方法、装置、电子设备及存储介质，涉及人工智能技术领域，该方法包括：获取待处理对象图像；对待处理对象图像进行图像质量分析，得到待处理对象图像对应的目标图像质量数据；根据目标图像质量数据，从多种预设图像质量条件对应多种口罩佩戴检测模型中匹配出目标口罩佩戴检测模型，目标图像质量数据与目标口罩佩戴检测模型对应的预设图像质量条件相匹配；基于目标口罩佩戴检测模型对待处理对象图像中的对象进行口罩佩戴检测，得到目标佩戴指示指标；基于目标佩戴指示指标，确定目标对象的口罩佩戴结果。利用本申请提供的技术方案可以提升口罩佩戴检测的准确性和有效性。

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于全局知识挖掘和前景注意力的交互视频动作检测方法有效

专利文献下载