[发明专利]一种云化架构下的记录数据剔重处理方法及系统有效
申请号: | 201710059113.2 | 申请日: | 2017-01-23 |
公开(公告)号: | CN106599326B | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 严丽君 | 申请(专利权)人: | 北京思特奇信息技术股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/174 |
代理公司: | 11212 北京轻创知识产权代理有限公司 | 代理人: | 杨立 |
地址: | 100086 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种云化架构下的记录数据剔重处理方法及系统,属于记录数据剔重处理领域,能对记录数据进行高速剔重处理和较长时间保存。本发明将收到的记录数据分为及时记录数据和迟到记录数据,将及时记录数据插入分布式内存数据库且提取关键信息建立索引数据,剔除重复记录后,输出为及时记录出口文件给下游使用,并将及时记录数据的索引数据导入HBASE数据库中;将迟到记录数据及对应的索引数据插入HBASE数据库,根据HBASE数据库中的索引数据剔除重复记录后,将非重复的迟到记录数据输出为迟到记录出口文件给下游使用。用于在数据接收时间跨度大的情况下对记录数据进行高速剔重处理。 | ||
搜索关键词: | 一种 架构 记录 数据 处理 方法 系统 | ||
【主权项】:
1.一种云化架构下的记录数据剔重处理方法,其特征在于,包括以下步骤:/nS1,根据预先设定的发生时间与收到时间的间隔范围,将从上游收到的记录数据分为及时记录数据和迟到记录数据;/nS2,将从上游收到的及时记录数据插入分布式内存数据库,提取及时记录数据的关键信息作为索引数据保存到分布式内存数据库中的索引表,剔除重复记录后将被保留的及时记录数据输出为及时记录出口文件给下游使用,并将对应的索引数据输出至及时记录索引文件,所述剔除重复记录的过程包括:将所述从上游收到的及时记录数据插入所述分布式内存数据库,根据该次插入操作的返回值判断该及时记录数据是否为重单,若是重单,则将该及时记录数据输出到重单文件,若不是重单,则将该及时记录数据作为被保留的及时记录数据进行后续处理;/nS3,根据S1中预先设定的发生时间与收到时间的间隔范围,按发生时间段将S2中输出的及时记录索引文件中的索引数据导入HBASE数据库;/nS4,在及时记录索引文件导入HBASE数据库的状态为已完成后,将从上游收到的迟到记录数据插入HBASE数据库,提取迟到记录数据的关键信息作为索引数据保存到HBASE数据库;/nS5,在HBASE数据库中对迟到记录数据进行剔除重复记录,将非重复的迟到记录数据输出为迟到记录出口文件给下游使用。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京思特奇信息技术股份有限公司,未经北京思特奇信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710059113.2/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置