[发明专利]一种数据并行排序方法和系统在审

专利信息
申请号: 201310446658.0 申请日: 2013-09-26
公开(公告)号: CN103530084A 公开(公告)日: 2014-01-22
发明(设计)人: 陈建;唐会军;齐路 申请(专利权)人: 北京奇虎科技有限公司;奇智软件(北京)有限公司
主分类号: G06F7/24 分类号: G06F7/24;G06F9/38;G06F17/30
代理公司: 北京市浩天知识产权代理事务所 11276 代理人: 韩龙;郭群
地址: 100088 北京市西城区新*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种数据并行排序方法和系统。该系统包括数据源、通过网络连接数据源的多个并行处理单元、以及通信接口。该方法包括将待排序的数据分成多个数据块,各并行处理单元分别获取数据块并进行采样;第一并行处理单元汇总各并行处理单元的采样数据并进行排序,根据并行处理单元的数量确定全局排序区间序列,将全局排序区间序列中各数据区间与各并行处理单元依次对应;各并行处理单元判断本单元获取的数据块中每个数据所属的数据区间并将该数据分发至对应的并行处理单元;各并行处理单元接收数据并进行局部排序;将各并行处理单元的局部排序结果顺序组合。本发明提高了大规模数据的排序速度,同时对数据量有较高的扩展性。
搜索关键词: 一种 数据 并行 排序 方法 系统
【主权项】:
一种数据并行排序方法,包括:将待排序的数据分成多个数据块,各并行处理单元分别获取一数据块并进行采样;第一并行处理单元汇总各并行处理单元采样得到的数据并进行排序,根据并行处理单元的数量确定全局排序区间序列,将全局排序区间序列中各数据区间与各并行处理单元依次对应;各并行处理单元判断本单元获取的数据块中每个数据所属的数据区间并将该数据分发至对应的并行处理单元;各并行处理单元接收数据并对属于本单元对应的数据区间的数据进行局部排序;将各并行处理单元的局部排序结果顺序组合。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310446658.0/,转载请声明来源钻瓜专利网。

同类专利
  • 一种基于归并树的全排序加速器及应用-201611222156.X
  • 李丽;陆沛栋;王堃;潘红兵;李伟;汪伟斌 - 南京大学
  • 2016-12-27 - 2019-04-23 - G06F7/24
  • 本发明的基于归并树的全排序加速器,包括:主控模块,接收运算信号,并根据所述运算信号确定排序、合并的次数、排序点数以及读写地址;输出控制信号,控制合并的开始和结束;运算单元,由若干比较器组成,根据所述运算信号执行比较逻辑运算,输出中间结果;FIFO存储单元,由若干寄存器组成,接收所述中间结果并存储,根据所述传输信号,执行中间结果的读写操作;主控制器与每一比较器、寄存器形成映射形成一个结点,所有结点形成归并树的处理结构。有益效果:资源开销较小使用更加灵活,同时有良好的并行性来满足高吞吐量系统的需求。
  • 一种用于数据管理与决策的计算装置-201510058056.7
  • 陈冀宽;吴汉铭 - 陈冀宽
  • 2015-02-04 - 2018-10-30 - G06F7/24
  • 一种用于数据管理与决策的计算装置,计算装置由系统排序单元、子集排序单元、计算单元群组的评价模块、决策模块构成。系统排序单元根据储存在数据源中的至少一笔数据的特征对于对应于至少一笔数据的至少一个以上元素进行排序而得到第一排序;子集排序单元,根据至少一笔数据的特征从具有第一排序的至少一个以上元素中选取子集合,对于子集合中的元素重新排序得到第二排序;计算单元群组计算第一排序与第二排序间的一致性相关程度,根据一致性相关程度以及第一评分计算关联于第一识别信息的第二评分,将第二评分储存在数据源中;决策模块从数据源取出第二评分,根据第二评分决定第一识别信息的级别,根据第一识别信息的级别而存取至少一笔数据。
  • 一种基于指针地址偏移的排序方法和设备-201710624603.2
  • 辛爱国;杨振江;同理;刘希童 - 北京北信源软件股份有限公司
  • 2017-07-27 - 2017-12-12 - G06F7/24
  • 本发明提供一种基于指针地址偏移的排序方法和设备用于解决现有技术中排序算法效率低的问题。其中方法包括接收一组不具有重复值的数据;根据该组数据新建指针数组;其中指针数组的大小等于该组数据的最大值和最小值之间的距离;遍历该组数据,根据该组数据中每一数值与最大值之间的距离对应的将指针数组中对应的单元赋值为指向该数值的指针;遍历该指针数组,从而获得按序排列的数据。本发明提高了特定场合下的排序速度。
  • 一种适宜于FPGA实现的排序方法-201710659445.4
  • 袁东华;王军;刘宝城;卢程程 - 电子科技大学
  • 2017-08-04 - 2017-11-28 - G06F7/24
  • 本发明属于堆排序领域,尤其涉及一种用于FPGA实现的排序方法。一种适宜于FPGA实现的堆排序方法,通过设计新的数据结构,把现有堆排序算法的二叉树结构修改为2k叉树,k≥2,增加数据比较的并行度,减少树的层数,从而减少对数据的访问次数,同时利用FPGA中RAM一个时钟可以输出多个数据的功能,可在一个时钟把要比较的2k孩子节点都读取出来,减少数据读取时间,使用2k叉树结构,简单地通过对非叶节点地址的移位和相加得到其孩子节点的地址,便于实现中的数据访问,降低实现的复杂度。本发明方法可大大降低排序的时延,提高排序模块的实时性。
  • 一种高速数据流中top‑n基数数据的估算方法-201610954101.1
  • 罗意;王小虎;石涵;王春鹏;赵晨晖 - 成都知道创宇信息技术有限公司
  • 2016-10-27 - 2017-03-15 - G06F7/24
  • 本发明提供了一种高速数据流中top‑n基数数据的估算方法,包括以下步骤定义“HyperLogLog Sketch矩阵”数据结构,设为S,其宽m高n,每个元素为一个HLL counter,对应的,有n个相互独立且哈希值为1~m的哈希函数,设为f1,f2,…,fn;当新数据D出现时,按业务进行分类,设为类型X;计算出xi=fi(X),其中i=1,2,…,n;在S(1,x1),S(2,x2),…,S(n,xn)中的HLL counter中计入D,得到更新后的基数,分别为Y1,Y2,…,Yn,再得到估算基数Y;将数据类型X与估算基数Y更新进top‑n。本发明方法简单并方便由硬件并行实现,可以用来计算数据类型的基数却不保存数据类型本身,具有良好的安全性。
  • 一种数据并行排序方法和系统-201310446658.0
  • 陈建;唐会军;齐路 - 北京奇虎科技有限公司;奇智软件(北京)有限公司
  • 2013-09-26 - 2014-01-22 - G06F7/24
  • 本发明公开了一种数据并行排序方法和系统。该系统包括数据源、通过网络连接数据源的多个并行处理单元、以及通信接口。该方法包括将待排序的数据分成多个数据块,各并行处理单元分别获取数据块并进行采样;第一并行处理单元汇总各并行处理单元的采样数据并进行排序,根据并行处理单元的数量确定全局排序区间序列,将全局排序区间序列中各数据区间与各并行处理单元依次对应;各并行处理单元判断本单元获取的数据块中每个数据所属的数据区间并将该数据分发至对应的并行处理单元;各并行处理单元接收数据并进行局部排序;将各并行处理单元的局部排序结果顺序组合。本发明提高了大规模数据的排序速度,同时对数据量有较高的扩展性。
  • 一种实现数据排序的电路和方法-201010138972.9
  • 俞尧;唐珏;周凡;李厚刚;孙旭光 - 国际商业机器公司
  • 2010-03-31 - 2011-10-05 - G06F7/24
  • 本发明公开了一种对长度为N的序列进行排序的电路,包括:N个存储单元,用于存储长度为N的序列,该N个存储单元分为R行和C列,其中,N=R×C;C个比较器,用于比较输入的新数据和C个存储单元存储的数据,输出比较信号;C个R选1多路开关,第k个R选1多路开关用于选择第k列的某一行的对应的存储单元存储的数据通过,输入给该列的比较器;N个控制信号命令寄存器,与所述N个存储单元对应,分别接收比较器的比较结果,输出的控制信号用于控制所述N个存储单元进行移位/插入/保持操作;流程控制模块,用于控制所述C个R选1多路开关的选通以及每一行的C个控制信号命令寄存器存储比较结果。
  • 数据排序方法和装置-201010213299.0
  • 洪荣峰 - 华为技术有限公司
  • 2010-06-18 - 2010-10-20 - G06F7/24
  • 本发明公开了一种数据排序方法和装置,属于数据处理领域。该方法包括:根据多个待处理数据的到达顺序,为该多个待处理数据添加序列号,根据该序列号,为该多个待处理的数据添加有效标记,并且在该序列号达到最大值溢出后,更换该有效标记;处理该多个待处理数据,得到多个处理结果;根据该序列号,并将该处理结果写入该存储器中;根据该有效标记,读取该存储器中的处理结果。还公开了一种数据排序装置。在读取报文处理结果之后,不需要通过删除有效标记的方式来避免报文处理结果被错误的多次读出,节省了有效标记的清除这一步骤,降低了排序RAM的读写次数,节省了芯片的功耗和资源。
  • 并行排序装置、方法及程序-200780047646.3
  • 枝广正人;山下庆子 - 日本电气株式会社
  • 2007-12-04 - 2009-10-28 - G06F7/24
  • 提供了一种其排序处理被加速的并行排序装置。基准值计算部件计算用作用于根据值的大小分配输入数据的区间的边界的多个基准值。输入数据聚集部件将输入数据划分为多个输入数据区域,并且通过并行处理计算用于将被划分的输入数据区域中的每一个中的数据分配给具有在由基准值计算部件计算的基准值上的边界的多个区间的映射信息。数据分配部件根据由输入数据聚集部件计算的映射信息通过并行处理将输入数据区域中每一个中的数据分配给多个区间。区间排序部件通过并行处理分别地排序由数据分配部件分配的多个区间中的数据。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top