[发明专利]基于分组掩码自回归模型的查询基数估计方法在审
申请号: | 202310401084.9 | 申请日: | 2023-04-15 |
公开(公告)号: | CN116662454A | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 荆一楠;乔冀瑜;张寒冰;徐伟;陈振强;何震瀛;王晓阳 | 申请(专利权)人: | 复旦大学;星环信息科技(上海)股份有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/2453;G06F18/23213;G06N3/04;G06N3/08 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于数据库查询技术领域,具体为一种基于分组掩码自回归模型的查询基数估计方法。本发明包括列数据分组预处理、分组掩码神经网络基数估计模型训练;列数据分组预处理将单表数据进行分组排序,使模型更好的学习到其中的联合概率分布;分组掩码神经网络基数估计模型通过位置编码以不同次序学习部分列的分布,模型训练分为数据训练、混合掩码训练、直接查询训练三个阶段且混合训练,组合不同的数据集对模型进行训练,降低模型的训练时间;从数据库系统执行日志中记录误差较大的查询信息并加入三阶段训练的数据中,提高模型的训练效率。本发明可以减少传统自回归模型进行基数估计时的查询误差,减少时耗,使得模型可以更快、更稳定用于基数估计。 | ||
搜索关键词: | 基于 分组 掩码 回归 模型 查询 基数 估计 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学;星环信息科技(上海)股份有限公司,未经复旦大学;星环信息科技(上海)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310401084.9/,转载请声明来源钻瓜专利网。