[发明专利]一种短暂上网事务中频繁共现账号挖掘方法有效

专利信息
申请号: 201510526575.1 申请日: 2015-08-25
公开(公告)号: CN105224593B 公开(公告)日: 2019-08-16
发明(设计)人: 刘琰;罗军勇;尹美娟;常斌;孙通;丁文博;刘悦蒙 申请(专利权)人: 中国人民解放军信息工程大学
主分类号: G06F16/907 分类号: G06F16/907
代理公司: 郑州天阳专利事务所(普通合伙) 41113 代理人: 聂孟民
地址: 450001 *** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及短暂上网事务中频繁共现账号挖掘方法,有效解决对单个上网账号的行为审计扩大到相关的多种应用、多个账号上,从而实现对用户上网行为的跨数据流跟踪和审计的问题,方法是,基于网络分流技术,在网络关口处镜像网络原始数据,基于浮动关键字匹配、正则表达式过滤,对网络中不同应用对应的数据流进行识别,提取社交应用的用户上网数据,按时间和上网地址进行汇总整理,形成上网短暂事务数据库,对待分析的用户上网原始流量所对应的事务数据库中的事务数据,找出频繁项集,计算项集间的重叠率,对频繁项集进行合并,得到归属于同一社会人的多个网络账号,本发明方法简单、易操作,能准确发现隐藏在网络通信流中网络帐号之间的关联性。
搜索关键词: 一种 短暂 上网 事务 频繁 账号 挖掘 方法
【主权项】:
1.一种短暂上网事务中频繁共现账号挖掘方法,其特征在于,包括以下步骤:(1)用户上网数据流获取:基于网络分流技术,在网络关口处镜像网络原始数据,这些数据承载了用户访问各种社交应用的通信数据,包括上网地址、上网账号、时间、应用数据;(2)用户上网元数据提取:以网络流量分类方法为基础,基于浮动关键字匹配、正则表达式过滤,对网络中不同应用对应的数据流进行识别,提取社交应用的用户上网数据,形成“元数据”,包括:源IP地址、协议、目的IP地址、时间、社交应用类型和网络账号数据;(3)短暂上网事务数据库构建:对步骤(2)得到的用户上网“元数据”按时间和上网地址进行汇总整理,将单位时间单个上网地址上出现的网络访问行为对应事务,网络行为中出现的上网账号对应事务中的项,构建事务数据库;形成上网短暂事务数据库,其中每个事务数据代表单位时间内单个本地地址向外访问的社交应用账号集;(4)频繁共现网络账号挖掘:对待分析的用户上网原始流量所对应的事务数据库中的每个事务数据,利用频繁模式挖掘算法找出所有事务数据中包含的频繁项集,得到频繁项集集合;(5)频繁共现网络账号归并:对每个频繁项集,计算项集间的重叠率,对频繁项集进行合并,将规模较小的项集归并到较大项集中,保证归并后项集中的账户具有关联性,得到归属于同一社会人的多个网络账号,从而实现短暂上网事务中频繁共现账号挖掘。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军信息工程大学,未经中国人民解放军信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510526575.1/,转载请声明来源钻瓜专利网。

同类专利
  • 一种自动获取群体用户作息时间的方法及系统-201610656595.5
  • 林中达 - 武汉科优达科技有限公司
  • 2016-08-11 - 2019-11-12 - G06F16/907
  • 本发明公开了一种自动获取群体用户作息时间的方法,涉及信息技术领域,包括获取每个用户的作息时间数据,作息时间数据包括用户标识,开始时间和结束时间;进行群体时间筛选后进行群体时间设定:进行群体时间筛选包括从作息时间数据中筛选出开始时间分布密集的时间区域的中心作为开始时间点,并筛选出结束时间分布密集的时间区域的中心作为结束时间点;进行群体时间设定包括以开始时间点作为群体开始时间、结束时间点作为群体结束时间。本发明可根据群体用户每天的实际作息情况自动生成群体用户作息时间。本发明公开了一种自动获取群体用户作息时间的系统。
  • 网络家电的数据处理方法和数据处理装置-201510011654.9
  • 张桂芳;程永甫;王晓燕;张宁宁 - 青岛海尔空调器有限总公司
  • 2015-01-09 - 2019-10-01 - G06F16/907
  • 本发明提供了一种网络家电的数据处理方法和数据处理装置。其中网络家电的数据处理方法包括:采集网络家电的网络硬件地址;以网络硬件地址作为搜索码值建立网络家电的索引记录;获取并保存网络家电的机型信息和安装信息;在索引记录中添加机型信息和安装信息的存储指针,以提供按照网络硬件地址进行查询的服务。利用本发明的方案,以网络家电的网络硬件地址作为网络家电数据管理数据库索引记录的搜索码值,将研发、生产、安装、售后各个阶段的信息进行整合,形成统一的网络家电数据管理平台,可以提供按照网络硬件地址进行各种网络家电信息的查询服务,便于后续使用以及维护的信息共享,提高了售后维护的工作效率和使用者的使用体验。
  • 标签推荐方法、装置及可读介质-201811562385.5
  • 杜东舫 - 腾讯科技(深圳)有限公司
  • 2018-12-20 - 2019-09-06 - G06F16/907
  • 本申请公开了一种标签推荐方法、装置及可读介质,涉及标签推荐领域。该方法包括:获取目标帐号、目标资源;通过被张量分解的标签推荐模型确定标签的推荐值,标签推荐模型被张量分解为核心张量和因子矩阵,核心张量的n个子张量中,目标子张量与因子矩阵对应相乘,其它子张量为0;确定标签数据中推荐值最高的n个标签作为向目标帐号推荐的标签。在通过标签推荐模型对标签进行推荐的过程中,由于核心张量中除了目标子张量外的其它子张量中的元素为0,即在等式关系中,核心张量中参与等式关系的仅包括目标子张量对应的部分,而其余部分并不参与该等式关系,避免了完整的三维核心张量导致时间复杂度过高的问题。
  • 一种短暂上网事务中频繁共现账号挖掘方法-201510526575.1
  • 刘琰;罗军勇;尹美娟;常斌;孙通;丁文博;刘悦蒙 - 中国人民解放军信息工程大学
  • 2015-08-25 - 2019-08-16 - G06F16/907
  • 本发明涉及短暂上网事务中频繁共现账号挖掘方法,有效解决对单个上网账号的行为审计扩大到相关的多种应用、多个账号上,从而实现对用户上网行为的跨数据流跟踪和审计的问题,方法是,基于网络分流技术,在网络关口处镜像网络原始数据,基于浮动关键字匹配、正则表达式过滤,对网络中不同应用对应的数据流进行识别,提取社交应用的用户上网数据,按时间和上网地址进行汇总整理,形成上网短暂事务数据库,对待分析的用户上网原始流量所对应的事务数据库中的事务数据,找出频繁项集,计算项集间的重叠率,对频繁项集进行合并,得到归属于同一社会人的多个网络账号,本发明方法简单、易操作,能准确发现隐藏在网络通信流中网络帐号之间的关联性。
  • 用于减少搜索过程中无关信息的系统和方法-201310611366.8
  • A·巴拉米;J·原 - 波音公司
  • 2013-11-26 - 2019-06-14 - G06F16/907
  • 一种用于减少搜索过程中无关信息的系统和方法。一种包括语境实体工厂(115)的系统(100),其中语境实体工厂被配置为建立定义语境感知的数据对象(162)的本体(122)的数据模型(120),该模型进一步包括定义数据对象(164)的元数据标签。该系统(100)进一步包括将数据对象(164)存储为已存储数据对象的存储装置(160),该装置进一步存储相应各个存储对象的相关联语境。该系统(100)进一步包括简化组件(140),其被配置为采集在本体(122)中定义的第一数据对象(162)的当前语境值,该组件进一步被配置为比较第一数据对象的当前语境值与相关联语境的存储值,并且其中当当前语境值与特定相关联语境的特定存储值不匹配时,该组件被进一步配置为将相应的特定存储数据对象(164)和特定的相关联语境从存储数据对象(166)移除。
  • 一种面向高校图书馆的图书个性化推荐方法和系统-201610481556.6
  • 周可;李春花;吕丹阳 - 华中科技大学
  • 2016-06-27 - 2019-05-31 - G06F16/907
  • 本发明公开了一种面向高校图书馆的图书个性化推荐的方法,解决高校图书馆现有的图书推荐算法中大规模数据存储和查询、可扩展性及推荐效果差的问题,其基本思路如下:首先将图书馆内的读者和图书等作为节点,构建图模型;其次,将读者的操作日志文件转化为读者‑图书类别偏好矩阵,和读者个人信息矩阵一起计算读者间的相似度,并把这些操作和挖掘出的信息作为边构建关联图谱;其次,将关联图谱和谱聚类相结合,提出了一种新的图书个性化推荐模型,计算得到关于读者的类簇分布;最后,当需要进行图书推荐时,在该读者对应的类簇中根据协同过滤算法计算出推荐图书列表。
  • 室内空气污染源分析系统及其方法-201510032448.6
  • 曾昭衡;王凰瑾;刘绍渊;康思源 - 台北科技大学
  • 2015-01-22 - 2019-05-31 - G06F16/907
  • 本发明公开一种室内空气污染源分析系统及其方法,通过预先建立场地数据库、污染源数据库、空气质量数据库以及空气质量指标数据库,藉由上述数据库循序渐进计算出特定室内场地的污染源与污染物对照数据、特定室内场地每一种污染源对应污染物的浓度指标值、特定室内场地每一种污染源对应污染物的危害分率值,再藉由规划求解演算法计算出特定室内场地每一种污染源的贡献比重,藉此可以达成精确找出室内空气污染源的贡献比重并提出对应改善方案的技术功效。
  • 标签的建立方法、装置、计算机设备及存储介质-201811534940.3
  • 杨镭;付晓;刘劲柏 - 深圳壹账通智能科技有限公司
  • 2018-12-14 - 2019-05-28 - G06F16/907
  • 本发明提供一种标签的建立方法、装置、计算机设备及存储介质,涉及数据处理技术领域。该标签的建立方法包括:在展示有规则配置的界面上接收配置数据;若所述规则配置为多项,则依据所述配置数据和配置逻辑对待匹配的标签进行匹配打分,得到打分结果;根据所述打分结果,建立标签。本方案用户可自行选择标签类别,可添加到多个同级或者不同级,自行编辑条件。同时新的标签生成后,系统会为其可信度进行评定打分,使标签结果更可靠,更客观。另外还可以保存修改人的信息,这样避免了员工离职交接不完善的问题。
  • 一种基于元数据链路的数据追踪方法及系统-201910095599.4
  • 李果;王新宇;卢国资;陈国镇;罗龙 - 三盟科技股份有限公司
  • 2019-01-31 - 2019-05-28 - G06F16/907
  • 本发明公开了一种基于元数据链路的数据追踪方法,包括:收集数据传输日志;根据数据传输日志生成字段级元数据链路;根据上传的查询条件,追踪到与查询条件匹配的字段级元数据链路;对字段级元数据链路进行可视化处理以生成图形界面。本发明还公开了一种基于元数据链路的数据追踪系统,包括收集模块,用于收集数据传输日志;生成模块,用于生成字段级元数据链路;追踪模块,用于根据上传的查询条件追踪与查询条件相匹配的字段级元数据链路;可视化模块,用于对字段级元数据链路进行可视化处理以生成图形界面。采用本发明,通过字段级元数据链路,能够快速追踪到具体的数据。
  • 基于6W场景的知识自学习方法-201610974857.2
  • 夏冬梅 - 红有软件股份有限公司
  • 2016-10-26 - 2019-04-30 - G06F16/907
  • 本发明提供一种基于6W场景的知识自学习方法,包括:根据元数据仓库中记录的6W场景数据,进行知识的自学习;其中,所述6W场景包括以下四类:场景重叠、场景相交、场景相切和场景相离;因此,知识的自学习包括以下四种:获得场景重叠知识;所述场景重叠知识,适用于感知与反馈;学习到场景相交知识;所述场景相交知识是用可控场景产生公共部分的知识,适用于对比分析;学习到场景相切知识;所述场景相切知识适用于异常判断;学习到场景相离知识;所述场景相离知识适用于预测和趋势分析。优点为:对现实中的各种场景进行了多种划分,有效地保证多种场景知识的学习的有效性和快速性。(3)学习过程简单易懂,方便对知识进行管理。
  • 数据处理方法、装置及系统-201310430540.9
  • 何涛;杨帅;罗伟 - 腾讯科技(深圳)有限公司
  • 2013-09-18 - 2019-04-30 - G06F16/907
  • 本发明提供一种数据处理方法,包括:服务器获取待统计的源数据,根据预置的处理进程分配规则与服务器内的所有已启动的进程,为待统计的源数据预分配处理进程;根据预置的源数据处理规则,将获取的源数据转换为统一格式的数据元;将转换后的数据元分发到对应的处理进程,处理进程根据预置的数据流处理规则,将数据元进行合并统计;以及输出合并统计后的数据元。此外,本发明还提供一种数据处理装置及系统。上述数据处理方法、装置及系统可极大地提高数据处理的效率。
  • 一种元数据管理查询的方法-201811279313.X
  • 姜腾光 - 郑州云海信息技术有限公司
  • 2018-10-30 - 2019-01-25 - G06F16/907
  • 本发明公开了一种元数据管理查询的方法,包括以下步骤:将数据存放在每一个node上;采用B+树对每一个node进行管理,非叶子节点的node增加一项entry,用来存放子节点的最大值以及最大值所在index;当元数据满足预设条件后,将元数据刷到磁盘中进行存储。本发明公开的元数据管理查询的方法,元数据管理统一采用B+树方式进行管理节点,在非叶子节点中增加一个entry用于存储该节点的子节点最大值以及最大值所在的index。当元数据满足一定条件后,进行刷盘,采用version思想进行刷盘。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top