[发明专利]使用加权训练数据的机器学习模型的多阶段训练技术在审

专利信息
申请号: 202080106731.8 申请日: 2020-10-27
公开(公告)号: CN116508036A 公开(公告)日: 2023-07-28
发明(设计)人: 陈实;王硕渊;张家琪 申请(专利权)人: 贝宝公司
主分类号: G06N20/20 分类号: G06N20/20
代理公司: 北京东方亿思知识产权代理有限责任公司 11258 代理人: 李宇红
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 公开了涉及使用加权训练数据的机器学习模型的多阶段训练的技术。在一些实施例中,计算机系统可以在至少两个阶段中训练机器学习分类模型。在初始训练阶段期间,计算机系统可以基于训练数据集来训练分类模型的初始版本,向训练数据集中的训练样本应用同等权重。计算机系统随后可以利用分类模型的初始版本来为训练样本生成模型得分。基于这些模型得分,计算机系统可以为训练样本生成相应的加权值。计算机系统随后可以执行后续训练阶段以生成分类模型的更新版本,其中,在这个后续训练阶段期间,至少一些训练样本被使用其各自的加权值来加权。
搜索关键词: 使用 加权 训练 数据 机器 学习 模型 阶段 技术
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝宝公司,未经贝宝公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202080106731.8/,转载请声明来源钻瓜专利网。

同类专利
  • 使用对等网络进行联合学习的系统和方法-202280012723.6
  • M·R·贝赫拉;S·乌帕迪亚;R·奥特;S·谢蒂 - 摩根大通国家银行
  • 2022-02-01 - 2023-10-20 - G06N20/20
  • 公开了使用对等网络进行联合学习的系统和方法。一种方法可以包括:使用一致性算法选举参与者节点作为协作者节点;协作者节点生成并广播公钥/私钥对;参与者节点针对与协作者节点的每次通信生成公钥/私钥对,利用协作者节点的公钥加密并广播包括用于参与者节点的本地机器学习模型的参数及其公钥的消息,协作者节点解密经加密的消息,利用解密后的参数更新聚合的机器学习模型,利用每个参与者节点的公钥加密并广播更新消息,每个更新消息包括更新;参与者节点利用它们的私钥解密消息中的一个,并且参与者节点利用更新来更新它们的本地机器学习模型。
  • 机器学习和深度学习模型的基于梯度的自动调整-201880062156.9
  • V·瓦拉达拉珍;S·伊蒂库拉;S·阿格尔沃;N·阿格尔沃 - 甲骨文国际公司
  • 2018-09-28 - 2023-09-19 - G06N20/20
  • 在本文中,水平可伸缩技术高效地配置机器学习算法以实现最佳准确度而无需知悉的输入。在实施例中,对于每个特定超参数,并且对于每个历元,计算机处理所述特定超参数。历元基于超参数元组探索一个超参数。从每个元组计算相应的分数。元组包含值的不同组合,每个值被包含在不同超参数的值范围内。元组的属于特定超参数的所有值都是不同的。元组的属于其它超参数的所有值都保持恒定。根据基于分数的第一线和基于分数的第二线的交点来缩小特定超参数的值范围。根据重复缩小的超参数值范围,最佳地配置机器学习算法。调用经配置的算法以获得结果。
  • 使用加权训练数据的机器学习模型的多阶段训练技术-202080106731.8
  • 陈实;王硕渊;张家琪 - 贝宝公司
  • 2020-10-27 - 2023-07-28 - G06N20/20
  • 公开了涉及使用加权训练数据的机器学习模型的多阶段训练的技术。在一些实施例中,计算机系统可以在至少两个阶段中训练机器学习分类模型。在初始训练阶段期间,计算机系统可以基于训练数据集来训练分类模型的初始版本,向训练数据集中的训练样本应用同等权重。计算机系统随后可以利用分类模型的初始版本来为训练样本生成模型得分。基于这些模型得分,计算机系统可以为训练样本生成相应的加权值。计算机系统随后可以执行后续训练阶段以生成分类模型的更新版本,其中,在这个后续训练阶段期间,至少一些训练样本被使用其各自的加权值来加权。
  • 用于联邦学习的电子设备以及方法-202180071695.0
  • 孙晨;吴松涛;崔焘 - 索尼集团公司
  • 2021-10-28 - 2023-07-25 - G06N20/20
  • 本公开提供了用于联邦学习的电子设备以及方法。中央处理装置处的用于联邦学习的电子设备包括处理电路,所述处理电路被配置为:确定多个分布式节点中用于生成全局模型参数的一组分布式节点,其中,所述一组分布式节点的本地训练数据之间的相关性满足特定相关性要求;以及基于所述一组分布式节点的本地模型参数生成全局模型参数,其中,所述本地模型参数是由所述一组分布式节点基于其各自的本地训练数据生成的。
  • 用于对网站交互进行机器自动分类的系统和方法-202180048755.7
  • C·R·马克森;A·C·波帕纳;R·拉金德兰;P·J·沙阿;C·G·勒默斯 - 快捷药方战略发展公司
  • 2021-07-06 - 2023-03-14 - G06N20/20
  • 一种系统,包括处理器和存储器。存储器存储包括多个模型的模型数据库和包括与输入相对应的分类分值的分类数据库。存储器存储由处理器执行的指令。所述指令包括,响应于从用户的用户设备接收到第一输入,针对第一输入,通过将所述多个模型应用于第一输出来确定分类的分类分值。每个模型确定一个分类分值。所述指令包括将与第一输入相关联的分类分值存储在分类数据库中,并且响应于与第一分类相对应的第一分类分值超过第一阈值,将第一输入识别为在第一分类内。所述指令包括将基于第一分类的第一输入发送到与第一分类相关联的第一分析员队列,用于在分析员设备上显示。
  • 用于联邦学习的装置、方法和存储介质-202180020218.1
  • 孙晨;吴松涛;许宽宏 - 索尼集团公司
  • 2021-03-15 - 2023-01-31 - G06N20/20
  • 一种用于联邦学习的装置、方法和存储介质。在该方法中,中央处理装置可以被配置为针对多个分布计算装置中的第一分布计算装置:接收来自第一分布计算装置的报告消息,所述报告消息包括第一分布计算装置的训练数据集信息或设备信息中的至少一者;以及基于第一分布计算装置的报告消息评估第一分布计算装置的联邦学习性能;基于第一分布计算装置的联邦学习性能确定第一分布计算装置的无线资源需求;以及通过消息通知无线网络基于所述无线资源需求为第一分布计算装置配置无线资源。
  • 使用一组反向模型进行的制造工艺预测建模-202180032652.1
  • 西德哈斯·巴提亚;德莫特·坎特维尔;塞尔盖·马尔科夫;冯捷 - 应用材料公司
  • 2021-05-20 - 2022-12-16 - G06N20/20
  • 本文中公开了用于执行预测建模以识别用于制造工艺的输入的技术。示例方法可以包括以下步骤:接收用于制造工艺的预期输出数据,其中该预期输出数据定义该制造工艺的输出的属性;访问对该制造工艺进行建模的多个机器学习模型;使用第一机器学习模型基于用于该制造工艺的该预期输出数据来确定用于该制造工艺的输入数据,其中该输入数据包括第一输入的值及第二输入的值;将使用该第一机器学习模型所确定的该输入数据与使用该第二机器学习模型所确定的输入数据组合在一起,以产生用于该制造工艺的一组输入,其中该组输入包括该第一输入的候选值及该第二输入的候选值。
  • 用于验证标签数据的系统和计算机实现的方法-202180004232.2
  • K·耶尔;M·本尤夫兹凯;E·加内桑 - 尤帕斯公司
  • 2021-10-28 - 2022-09-30 - G06N20/20
  • 一种用于验证标签数据的系统和计算机实现的方法包括:接收标签数据,并且使用第一机器学习模型将其分割为一个或多个部分。进一步地,包括文本和图像的第一多个属性从经分割的标签数据被提取。该方法还包括:接收与标签数据相关联的真实数据,并且从真实数据提取第二多个属性。第一多个属性和第二多个属性然后使用第二机器学习模型进行比较,并且比较结果被显示在三个窗格用户界面上。进一步地,标签数据基于所显示的结果而被验证。
  • 基于信令交互的AI注智-201980103390.6
  • 欧阳晔;蒋乐;杨爱东;孟祥德;经琴 - 亚信科技(中国)有限公司
  • 2019-12-31 - 2022-08-12 - G06N20/20
  • 人工智能(AI)平台侧的电子设备(400),所述AI平台侧能够与应用侧进行信令交互以执行具有相同应用配置的至少一次AI注智过程,所述电子设备(400)包括处理电路(402),所述处理电路被配置为接收来自应用侧的针对所述至少一次AI注智过程的配置请求,所述配置请求包括指示应用配置的信息;并且在所述应用配置得到满足的情况下,分派所述应用配置以供所述至少一次AI注智过程运行时使用。
  • 联邦机器学习的方法和服务器-201980102933.2
  • P·克里希纳斯瓦米;L·阿南塔拉曼;F·古列特诺;何勉 - 新加坡科技研究局
  • 2019-12-10 - 2022-07-22 - G06N20/20
  • 本发明提供了一种使用至少一个处理器的联邦机器学习的方法,所述方法包括:将当前全局机器学习模型传输到复数个数据源中的每一个;分别从所述复数个数据源接收复数个训练更新,所述复数个训练更新中的每一个由相应的所述数据源响应于接收到的所述全局机器学习模型而生成;并且分别基于接收到的所述复数个训练更新以及与所述复数个数据源相关联的复数个数据质量参数来更新所述当前全局机器学习模型,以生成更新的全局机器学习模型。还提供了用于联邦机器学习的相应的服务器。
  • 数据标签验证-202080080771.X
  • A.乔瓦尼尼;G.查劳罗斯;F.弗洛策;P.勒斯滕伯格;D.迈什泰尔哈齐;S.拉维扎;E.斯洛特克 - 国际商业机器公司
  • 2020-11-25 - 2022-07-08 - G06N20/20
  • 本发明的各方面公开了一种用于验证数据集的记录的标签的方法。所述记录包括样本数据和多个标签中的相关的标签。该方法包括一个或多个处理器将数据集划分成训练数据集和推断数据集,训练数据集包括与选择的标签相关的记录,推断数据集包括具有与选择的标签和多个标签中的所有其他标签相关的样本数据的记录。所述方法还包括将训练数据集划分成多个学习器训练数据集,多个学习器训练数据集包括与选择的标签相关的至少一个样本。该方法还包括利用学习器训练数据集之一来训练多个标签特定的小样本学习器。该方法还包括由多个训练的标签特定的小样本学习器对推断数据集执行推断,以生成多个预测的标签输出值的集合。
  • 将模型输出组合为组合模型输出-202080077551.1
  • I·费德劳夫;F·穆谢诺克;H-A·维施曼 - 皇家飞利浦有限公司
  • 2020-11-04 - 2022-06-21 - G06N20/20
  • 本发明涉及一种预测系统(100),用于将多个经训练模型应用于输入实例,例如用于医学图像中的对象的检测或分割。多个经训练模型形成组合模型。经训练模型通过确定输入实例在公共潜在空间中的表示并由此确定相应的模型输出来确定输入实例的模型输出。组合模型还包括多个经训练模型的数据集指纹,其表征了其在潜在空间中的训练实例的表示。为了确定输入实例的组合模型的输出,确定输入实例和多个经训练模型之间的对应性分数,其指示了输入实例和潜在空间中的相应训练数据集之间的对应性。通过根据对应性分数组合各个模型,来确定组合模型输出。
  • 基于安全的预测设备、系统和方法-202080072364.4
  • 埃姆雷·厄泽 - ARM有限公司
  • 2020-03-18 - 2022-06-03 - G06N20/20
  • 本发明提供了基于安全的预测设备、系统和方法。机器学习硬件加速器(MLHA)包括主分类器(MC)模块、至少一个监控分类器(GC)模块和最终预测类别决策模块。该MC模块基于输入数据预测MC预测类别,并且包括具有至少一个安全关键(SC)类别和多个非SC类别的预训练的机器学习主分类器(MLMC)。每个监控分类器(GC)模块与SC类别相关联,并且基于该输入数据预测GC预测类别。每个GC模块包括具有两个类别的预训练的机器学习监控分类器(MLGC),这两个类别包括相关联SC类别和残差类别,该残差类别包括任何非相关联SC类别和该多个非SC类别。决策模块基于该MC预测类别和每个GC预测类别确定并输出最终预测类别。
  • 自动化人工智能径向可视化-202080060842.X
  • T·萨洛尼迪斯;J·D·埃弗斯曼;王大阔;A·斯维因;G·布兰布尔;鞠琳;N·马齐泰利;V·苏帕杜利亚 - 国际商业机器公司
  • 2020-08-25 - 2022-04-05 - G06N20/20
  • 提供了用于提供自动化机器学习可视化的方法、系统以及计算机程序产品。机器学习任务、变换器以及估计器可以被接收到一个或多个机器学习组成模块中。机器学习组成模块生成一个或多个机器学习模型。机器学习模型流水线是变换器和估计器的序列,机器学习流水线的集合体是机器学习流水线的集合体。可以使用机器学习组成模块来生成机器学习模型流水线、多个机器学习模型流水线的集合体、或它们的组合以及对应的元数据。可以从机器学习模型流水线、多个机器学习模型流水线的集合体、或它们的组合中提取元数据。可以生成机器学习模型流水线、多个机器学习模型流水线的集合体或它们的组合、以及所提取的元数据的交互式可视化图形用户界面。
  • 基于元学习的自动特征子集选择-202080028693.9
  • T·卡那格尔;S·伊蒂库拉;H·F·莫汉达姆;N·阿格尔沃 - 甲骨文国际公司
  • 2020-03-30 - 2021-12-14 - G06N20/20
  • 本发明涉及机器学习(ML)模型的降维。本文中的技术是对特征进行单独排名并基于其排名对特征进行组合以实现特征的最优组合,该最优组合可以加速训练和/或推理、防止过度拟合和/或提供对在某种程度上神秘的数据集的洞察。在实施例中,计算机对训练语料库的数据集的特征进行排名。对于每个数据集和每个界标百分比,目标ML模型被配置为仅接收特征中的排名最高的界标百分比的特征,并且测量通过使用数据集训练ML模型实现的界标准确度。基于数据集的界标准确度和元特征值,为每个数据集生成相应的训练元组。基于所有训练元组,对回归器进行训练以预测用于训练目标ML模型的最优特征数量。
  • 用于分类和意图确定的多模型结构-202080028839.X
  • 王昱;沈逸麟;邓岳;金红霞 - 三星电子株式会社
  • 2020-03-20 - 2021-11-23 - G06N20/20
  • 基于一个或多个多模型结构的意图确定可以包括响应于接收到的输入从多个领域特定模型中的每一个生成输出。领域特定模型可以包括使用针对每个领域特定模型的相应局部损失度量和针对所述多个领域特定模型的全局损失度量而训练的经同时训练的机器学习模型。可以通过对每个领域特定模型的输出进行分类来确定与一个或多个领域特定模型相对应的意图的存在与否。
  • 用于具有可编程人机混合集成学习的预报警报的系统和方法-201980094466.3
  • 阿鲁纳·贾马拉马达卡;大卫·J·休柏;山缪·D·强森;采青·卢 - HRL实验室有限责任公司
  • 2019-12-13 - 2021-11-05 - G06N20/20
  • 一种用于计算人机混合集成预测的方法,包括:接收个别预报问题[IFF];将IFF分类到多个典型问题主题中的一个;标识与所述典型问题主题相关联的机器模型;对于所述机器模型中的每一机器模型:从多个人类参与者中的一个人类参与者接收:第一任务输入,包括对训练数据集的选择;第二任务输入,包括对所选择的训练数据集的部分的选择;以及第三任务输入,包括用于配置所述机器模型的模型参数;根据所述第一、第二和第三任务输入训练所述机器模型;以及基于所训练的机器模型计算机器模型预报;从由所述机器模型计算的机器模型预报来计算聚合预报;以及响应于确定所述聚合预报满足阈值条件而发送警报。
  • 用于减少机器学习中的数据存储的系统和方法-201980018626.6
  • 马渕充启 - 丰田研究所股份有限公司
  • 2019-02-14 - 2021-06-04 - G06N20/20
  • 公开了用于通过用多个二维图像替换三维模型来减少用于机器学习的训练数据所必需的数据存储量和/或处理能力的方法和系统。该方法包括从三维模型确定感兴趣的对象,并将感兴趣的对象裁剪为多个二维图像。裁剪多个二维图像使得仅保留感兴趣的对象。针对诸如道路宽度、道路角度或关于相邻车辆的角度之类的特定属性来裁剪多个二维图像。图像捕获设备捕获实时背景图像。使用相关联的属性对背景图像内的对象进行分类。将属性与多个二维图像合成,使得生成具有实时背景的3D模型的多个副本二维图像。
  • 使用特征排名和可扩展的自动搜索进行自动特征子集选择-201980067625.0
  • T·卡那格尔;S·伊蒂库拉;N·阿格尔沃 - 甲骨文国际公司
  • 2019-10-01 - 2021-05-25 - G06N20/20
  • 本发明涉及用于机器学习(ML)模型的降维。本文中的技术是对特征进行单独排名并基于其排名组合特征以实现特征的最佳组合,该组合可以加速训练和/或推理、防止过度拟合和/或提供对在某种程度上神秘的数据集的洞察。在实施例中,对于训练数据集的每个特征,计算机基于相关性评分函数和在训练数据集中出现的特征的值的统计信息计算相关性得分。为每个特征计算基于特征的相关性得分的排名。基于特征的排名,生成特征的不同子集的序列。对于不同特征子集的序列中的每个不同子集,基于训练针对不同子集配置的机器学习(ML)模型来生成适合度得分。
  • 自动化的本地化机器学习训练-201880086373.1
  • K·L·基梅尔;J·B·赫斯基思;E·L·琼斯;J·L·南斯;L·T·史密斯 - 微软技术许可有限责任公司
  • 2018-12-20 - 2020-08-28 - G06N20/20
  • 用于生成机器学习模型以从物理传感器数据中检测事件实例的技术,包括:将第一机器学习模型应用于来自一位置处的第一物理传感器的第一传感器数据以检测事件实例,确定使用该第一机器学习模型的性能度量不在期望参数范围内,在一时间段期间从与该第一物理传感器相同位置处的第二物理传感器获得第二传感器数据,在该时间段期间从该第一物理传感器获得第三传感器数据,通过基于使用该第二传感器数据检测到的训练事件实例选择该第三传感器数据的各部分来生成因位置而异的训练数据,使用该因位置而异的训练数据来训练第二ML模型,以及应用该第二ML模型而非该第一ML模型来检测事件实例。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top