[发明专利]使用加权训练数据的机器学习模型的多阶段训练技术在审

申请号：	202080106731.8	申请日：	2020-10-27
公开（公告）号：	CN116508036A	公开（公告）日：	2023-07-28
发明（设计）人：	陈实;王硕渊;张家琪	申请（专利权）人：	贝宝公司
主分类号：	G06N20/20	分类号：	G06N20/20
代理公司：	北京东方亿思知识产权代理有限责任公司 11258	代理人：	李宇红
地址：	美国加利***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：	公开了涉及使用加权训练数据的机器学习模型的多阶段训练的技术。在一些实施例中，计算机系统可以在至少两个阶段中训练机器学习分类模型。在初始训练阶段期间，计算机系统可以基于训练数据集来训练分类模型的初始版本，向训练数据集中的训练样本应用同等权重。计算机系统随后可以利用分类模型的初始版本来为训练样本生成模型得分。基于这些模型得分，计算机系统可以为训练样本生成相应的加权值。计算机系统随后可以执行后续训练阶段以生成分类模型的更新版本，其中，在这个后续训练阶段期间，至少一些训练样本被使用其各自的加权值来加权。
搜索关键词：	使用加权训练数据机器学习模型阶段技术
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于贝宝公司，未经贝宝公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202080106731.8/，转载请声明来源钻瓜专利网。

同类专利

用于基于多变量时间序列数据的多域集成学习的系统、方法和计算机程序产品-202280011256.5
发明人：何林芸;S·阿格拉瓦尔;林郁珊;吴宇航;I·宾德利什;C·切蒂亚;王飞 -专利权人：维萨国际服务协会
申请日： 2022-10-20 - 公布日： 2023-10-27 - 主分类号： G06N20/20
摘要：提供了用于基于多变量时间序列数据的多域集成学习的系统、方法和计算机程序产品。一种方法可以包括接收多变量序列数据。多变量序列数据的至少一部分可以被输入到多个异常检测模型中，以生成多个分数。多变量序列数据可以与多个分数组合，以生成组合式中间数据。组合式中间数据可以被输入到组合式集成模型中，以生成输出分数。响应于确定输出分数满足阈值，进行以下中的至少一项：可以向用户设备通信传送警报，可以将多变量序列数据输入到特征域集成模型中以生成特征重要性向量，或者可以更新模型域集成模型、时域集成模型、特征域集成模型或组合式集成模型中的至少一者。

使用对等网络进行联合学习的系统和方法-202280012723.6
发明人： M·R·贝赫拉;S·乌帕迪亚;R·奥特;S·谢蒂 -专利权人：摩根大通国家银行
申请日： 2022-02-01 - 公布日： 2023-10-20 - 主分类号： G06N20/20
摘要：公开了使用对等网络进行联合学习的系统和方法。一种方法可以包括：使用一致性算法选举参与者节点作为协作者节点；协作者节点生成并广播公钥/私钥对；参与者节点针对与协作者节点的每次通信生成公钥/私钥对，利用协作者节点的公钥加密并广播包括用于参与者节点的本地机器学习模型的参数及其公钥的消息，协作者节点解密经加密的消息，利用解密后的参数更新聚合的机器学习模型，利用每个参与者节点的公钥加密并广播更新消息，每个更新消息包括更新；参与者节点利用它们的私钥解密消息中的一个，并且参与者节点利用更新来更新它们的本地机器学习模型。

使用在多个应用之间共享的机器学习模型的设备和方法-202180094282.4
发明人：李贤洙;金武永 -专利权人：三星电子株式会社
申请日： 2021-03-18 - 公布日： 2023-10-17 - 主分类号： G06N20/20
摘要：电子设备可以将目标应用映射到多个机器学习模型中与目标应用的请求相匹配的机器学习模型，可以基于由至少一个传感器感测的感测数据来生成用于感测对应于机器学习模型的数据的推断结果，并且可以将生成的推断结果传送到目标应用和另一应用中的至少一个。

处理的混合物理/机器学习建模-202280012111.7
发明人：普拉沙斯·科斯努;卡廷克·拉马斯瓦米;阿吉特•巴拉克里斯南;卡尔蒂克·萨哈;乌梅什•克尔卡尔;维希瓦·帕迪;普拉松·舒克拉;苏希尔·阿伦·萨曼特 -专利权人：应用材料公司
申请日： 2022-01-05 - 公布日： 2023-09-22 - 主分类号： G06N20/20
摘要：本文所述的实施方式包括用于产生为半导体处理设备中的处理建模的混合模型的处理。在特定实施方式中，建立混合机器学习模型的方法包含识别跨越第一范围的处理和/或硬件参数的第一组案例，并且在实验室中针对第一组案例进行实验。该方法可进一步包含编译来自实验的实验输出，并且针对第一组案例进行基于物理的模拟。在实施方式中，该方法可进一步包含编译来自模拟的模型输出，并且利用机器学习算法将模型输出与实验输出相关联以提供混合机器学习模型。

机器学习和深度学习模型的基于梯度的自动调整-201880062156.9
发明人： V·瓦拉达拉珍;S·伊蒂库拉;S·阿格尔沃;N·阿格尔沃 -专利权人：甲骨文国际公司
申请日： 2018-09-28 - 公布日： 2023-09-19 - 主分类号： G06N20/20
摘要：在本文中，水平可伸缩技术高效地配置机器学习算法以实现最佳准确度而无需知悉的输入。在实施例中，对于每个特定超参数，并且对于每个历元，计算机处理所述特定超参数。历元基于超参数元组探索一个超参数。从每个元组计算相应的分数。元组包含值的不同组合，每个值被包含在不同超参数的值范围内。元组的属于特定超参数的所有值都是不同的。元组的属于其它超参数的所有值都保持恒定。根据基于分数的第一线和基于分数的第二线的交点来缩小特定超参数的值范围。根据重复缩小的超参数值范围，最佳地配置机器学习算法。调用经配置的算法以获得结果。

使用加权训练数据的机器学习模型的多阶段训练技术-202080106731.8
发明人：陈实;王硕渊;张家琪 -专利权人：贝宝公司
申请日： 2020-10-27 - 公布日： 2023-07-28 - 主分类号： G06N20/20
摘要：公开了涉及使用加权训练数据的机器学习模型的多阶段训练的技术。在一些实施例中，计算机系统可以在至少两个阶段中训练机器学习分类模型。在初始训练阶段期间，计算机系统可以基于训练数据集来训练分类模型的初始版本，向训练数据集中的训练样本应用同等权重。计算机系统随后可以利用分类模型的初始版本来为训练样本生成模型得分。基于这些模型得分，计算机系统可以为训练样本生成相应的加权值。计算机系统随后可以执行后续训练阶段以生成分类模型的更新版本，其中，在这个后续训练阶段期间，至少一些训练样本被使用其各自的加权值来加权。

用于联邦学习的电子设备以及方法-202180071695.0
发明人：孙晨;吴松涛;崔焘 -专利权人：索尼集团公司
申请日： 2021-10-28 - 公布日： 2023-07-25 - 主分类号： G06N20/20
摘要：本公开提供了用于联邦学习的电子设备以及方法。中央处理装置处的用于联邦学习的电子设备包括处理电路，所述处理电路被配置为：确定多个分布式节点中用于生成全局模型参数的一组分布式节点，其中，所述一组分布式节点的本地训练数据之间的相关性满足特定相关性要求；以及基于所述一组分布式节点的本地模型参数生成全局模型参数，其中，所述本地模型参数是由所述一组分布式节点基于其各自的本地训练数据生成的。

源于人工决策的机器学习模型训练-202180061531.X
发明人： L·布雷默;H·K·巴布;T·K·斯图尔特;M·奥伯霍菲尔 -专利权人：国际商业机器公司
申请日： 2021-07-20 - 公布日： 2023-05-12 - 主分类号： G06N20/20
摘要：在用于源于人工决策来改进用于数据匹配的机器学习模型训练的方法中，一个或多个计算机处理器检测对两个数据记录做出的校正。一个或多个计算机处理器确定这两个数据记录之间的共同属性。一个或多个计算机处理器识别与共同属性相关联的第一机器学习模型。一个或多个计算机处理器将两个数据记录的比较数据添加至机器学习模型的训练数据，其中比较数据包括校正。

用于分布式事件分类和路由的系统和方法-202080093457.5
发明人： B·阿尔扎尼;高佳琦;R·G·比安基尼;F·维伊拉·弗鲁杰拉;王霄航;H·李;D·A·马尔兹 -专利权人：微软技术许可有限责任公司
申请日： 2020-12-11 - 公布日： 2023-03-21 - 主分类号： G06N20/20
摘要：本公开的各方面涉及云环境中的事件路由。在一个示例中，云提供方团队利用侦察器框架来基于团队的专业知识构建团队特定侦察器。在示例中，检测到事件并将描述发送给每个团队特定侦察器。每个团队特定侦察器使用由团队提供的事件描述和侦察器规范来标识、访问、和处理来自云组件的与事件相关的监控数据。每个团队特定侦察器利用一个或多个机器学习模型来评估监控数据并生成有关团队是否负责解决事件的事件分类预测。在示例中，侦察器主管接收来自每个团队特定侦察器的预测，并比较这些预测以确定应将事件路由到哪个团队。

用于对网站交互进行机器自动分类的系统和方法-202180048755.7
发明人： C·R·马克森;A·C·波帕纳;R·拉金德兰;P·J·沙阿;C·G·勒默斯 -专利权人：快捷药方战略发展公司
申请日： 2021-07-06 - 公布日： 2023-03-14 - 主分类号： G06N20/20
摘要：一种系统，包括处理器和存储器。存储器存储包括多个模型的模型数据库和包括与输入相对应的分类分值的分类数据库。存储器存储由处理器执行的指令。所述指令包括，响应于从用户的用户设备接收到第一输入，针对第一输入，通过将所述多个模型应用于第一输出来确定分类的分类分值。每个模型确定一个分类分值。所述指令包括将与第一输入相关联的分类分值存储在分类数据库中，并且响应于与第一分类相对应的第一分类分值超过第一阈值，将第一输入识别为在第一分类内。所述指令包括将基于第一分类的第一输入发送到与第一分类相关联的第一分析员队列，用于在分析员设备上显示。

用于联邦学习的装置、方法和存储介质-202180020218.1
发明人：孙晨;吴松涛;许宽宏 -专利权人：索尼集团公司
申请日： 2021-03-15 - 公布日： 2023-01-31 - 主分类号： G06N20/20
摘要：一种用于联邦学习的装置、方法和存储介质。在该方法中，中央处理装置可以被配置为针对多个分布计算装置中的第一分布计算装置：接收来自第一分布计算装置的报告消息，所述报告消息包括第一分布计算装置的训练数据集信息或设备信息中的至少一者；以及基于第一分布计算装置的报告消息评估第一分布计算装置的联邦学习性能；基于第一分布计算装置的联邦学习性能确定第一分布计算装置的无线资源需求；以及通过消息通知无线网络基于所述无线资源需求为第一分布计算装置配置无线资源。

使用一组反向模型进行的制造工艺预测建模-202180032652.1
发明人：西德哈斯·巴提亚;德莫特·坎特维尔;塞尔盖·马尔科夫;冯捷 -专利权人：应用材料公司
申请日： 2021-05-20 - 公布日： 2022-12-16 - 主分类号： G06N20/20
摘要：本文中公开了用于执行预测建模以识别用于制造工艺的输入的技术。示例方法可以包括以下步骤：接收用于制造工艺的预期输出数据，其中该预期输出数据定义该制造工艺的输出的属性；访问对该制造工艺进行建模的多个机器学习模型；使用第一机器学习模型基于用于该制造工艺的该预期输出数据来确定用于该制造工艺的输入数据，其中该输入数据包括第一输入的值及第二输入的值；将使用该第一机器学习模型所确定的该输入数据与使用该第二机器学习模型所确定的输入数据组合在一起，以产生用于该制造工艺的一组输入，其中该组输入包括该第一输入的候选值及该第二输入的候选值。

利用多个处理单元来对可编程逻辑控制器进行分布式提升的神经网络系统-202080099845.4
发明人：夏魏喜;于小文;沙尚克·塔马斯卡;胡安·L·阿帕里西奥·奥赫亚;海科·克劳森;伊内斯·乌加尔德·迪亚斯;马丁·泽尔;欧根·索洛乔;温成涛 -专利权人：西门子股份公司
申请日： 2020-04-17 - 公布日： 2022-11-25 - 主分类号： G06N20/20
摘要：分布式神经网络提升是由神经网络系统通过操作至少一个处理器来执行的。一种方法，该方法包括提供提升算法，该提升算法将模型分布在多个处理单元中，每个处理单元是能够彼此独立地执行计算同时处理数据的多个弱学习器中的弱学习器。该方法还包括启用分布式集成学习，该分布式集成学习使可编程逻辑控制器(PLC)能使用多个处理单元中的一个以上的处理单元来对应用进行缩放，以及使用提升算法来训练多个弱学习器。多个弱学习器是不捕捉整个数据分布并且被有目的地设计用于以较低准确度进行预测的机器学习模型。该方法还包括：使用多个弱学习器以基于神经网络的前馈计算来为最终假设投票。

一种基于联邦学习的模型训练方法、电子设备及存储介质-202080098459.3
发明人：田文强;沈嘉 -专利权人： OPPO广东移动通信有限公司
申请日： 2020-03-11 - 公布日： 2022-11-01 - 主分类号： G06N20/20
摘要：一种基于联邦学习的模型训练方法，包括：子节点设备发送局部模型的模型参数和所述局部模型对应的权重信息(S201)；所述模型参数和所述权重信息用于主节点设备训练全局模型。还公开了另一种基于联邦学习的模型训练方法、电子设备及存储介质。

用于验证标签数据的系统和计算机实现的方法-202180004232.2
发明人： K·耶尔;M·本尤夫兹凯;E·加内桑 -专利权人：尤帕斯公司
申请日： 2021-10-28 - 公布日： 2022-09-30 - 主分类号： G06N20/20
摘要：一种用于验证标签数据的系统和计算机实现的方法包括：接收标签数据，并且使用第一机器学习模型将其分割为一个或多个部分。进一步地，包括文本和图像的第一多个属性从经分割的标签数据被提取。该方法还包括：接收与标签数据相关联的真实数据，并且从真实数据提取第二多个属性。第一多个属性和第二多个属性然后使用第二机器学习模型进行比较，并且比较结果被显示在三个窗格用户界面上。进一步地，标签数据基于所显示的结果而被验证。

基于信令交互的AI注智-201980103390.6
发明人：欧阳晔;蒋乐;杨爱东;孟祥德;经琴 -专利权人：亚信科技（中国）有限公司
申请日： 2019-12-31 - 公布日： 2022-08-12 - 主分类号： G06N20/20
摘要：人工智能(AI)平台侧的电子设备(400)，所述AI平台侧能够与应用侧进行信令交互以执行具有相同应用配置的至少一次AI注智过程，所述电子设备(400)包括处理电路(402)，所述处理电路被配置为接收来自应用侧的针对所述至少一次AI注智过程的配置请求，所述配置请求包括指示应用配置的信息；并且在所述应用配置得到满足的情况下，分派所述应用配置以供所述至少一次AI注智过程运行时使用。

联邦机器学习的方法和服务器-201980102933.2
发明人： P·克里希纳斯瓦米;L·阿南塔拉曼;F·古列特诺;何勉 -专利权人：新加坡科技研究局
申请日： 2019-12-10 - 公布日： 2022-07-22 - 主分类号： G06N20/20
摘要：本发明提供了一种使用至少一个处理器的联邦机器学习的方法，所述方法包括：将当前全局机器学习模型传输到复数个数据源中的每一个；分别从所述复数个数据源接收复数个训练更新，所述复数个训练更新中的每一个由相应的所述数据源响应于接收到的所述全局机器学习模型而生成；并且分别基于接收到的所述复数个训练更新以及与所述复数个数据源相关联的复数个数据质量参数来更新所述当前全局机器学习模型，以生成更新的全局机器学习模型。还提供了用于联邦机器学习的相应的服务器。

数据标签验证-202080080771.X
发明人： A.乔瓦尼尼;G.查劳罗斯;F.弗洛策;P.勒斯滕伯格;D.迈什泰尔哈齐;S.拉维扎;E.斯洛特克 -专利权人：国际商业机器公司
申请日： 2020-11-25 - 公布日： 2022-07-08 - 主分类号： G06N20/20
摘要：本发明的各方面公开了一种用于验证数据集的记录的标签的方法。所述记录包括样本数据和多个标签中的相关的标签。该方法包括一个或多个处理器将数据集划分成训练数据集和推断数据集，训练数据集包括与选择的标签相关的记录，推断数据集包括具有与选择的标签和多个标签中的所有其他标签相关的样本数据的记录。所述方法还包括将训练数据集划分成多个学习器训练数据集，多个学习器训练数据集包括与选择的标签相关的至少一个样本。该方法还包括利用学习器训练数据集之一来训练多个标签特定的小样本学习器。该方法还包括由多个训练的标签特定的小样本学习器对推断数据集执行推断，以生成多个预测的标签输出值的集合。

将模型输出组合为组合模型输出-202080077551.1
发明人： I·费德劳夫;F·穆谢诺克;H-A·维施曼 -专利权人：皇家飞利浦有限公司
申请日： 2020-11-04 - 公布日： 2022-06-21 - 主分类号： G06N20/20
摘要：本发明涉及一种预测系统(100)，用于将多个经训练模型应用于输入实例，例如用于医学图像中的对象的检测或分割。多个经训练模型形成组合模型。经训练模型通过确定输入实例在公共潜在空间中的表示并由此确定相应的模型输出来确定输入实例的模型输出。组合模型还包括多个经训练模型的数据集指纹，其表征了其在潜在空间中的训练实例的表示。为了确定输入实例的组合模型的输出，确定输入实例和多个经训练模型之间的对应性分数，其指示了输入实例和潜在空间中的相应训练数据集之间的对应性。通过根据对应性分数组合各个模型，来确定组合模型输出。

基于安全的预测设备、系统和方法-202080072364.4
发明人：埃姆雷·厄泽 -专利权人： ARM有限公司
申请日： 2020-03-18 - 公布日： 2022-06-03 - 主分类号： G06N20/20
摘要：本发明提供了基于安全的预测设备、系统和方法。机器学习硬件加速器(MLHA)包括主分类器(MC)模块、至少一个监控分类器(GC)模块和最终预测类别决策模块。该MC模块基于输入数据预测MC预测类别，并且包括具有至少一个安全关键(SC)类别和多个非SC类别的预训练的机器学习主分类器(MLMC)。每个监控分类器(GC)模块与SC类别相关联，并且基于该输入数据预测GC预测类别。每个GC模块包括具有两个类别的预训练的机器学习监控分类器(MLGC)，这两个类别包括相关联SC类别和残差类别，该残差类别包括任何非相关联SC类别和该多个非SC类别。决策模块基于该MC预测类别和每个GC预测类别确定并输出最终预测类别。

自动化人工智能径向可视化-202080060842.X
发明人： T·萨洛尼迪斯;J·D·埃弗斯曼;王大阔;A·斯维因;G·布兰布尔;鞠琳;N·马齐泰利;V·苏帕杜利亚 -专利权人：国际商业机器公司
申请日： 2020-08-25 - 公布日： 2022-04-05 - 主分类号： G06N20/20
摘要：提供了用于提供自动化机器学习可视化的方法、系统以及计算机程序产品。机器学习任务、变换器以及估计器可以被接收到一个或多个机器学习组成模块中。机器学习组成模块生成一个或多个机器学习模型。机器学习模型流水线是变换器和估计器的序列，机器学习流水线的集合体是机器学习流水线的集合体。可以使用机器学习组成模块来生成机器学习模型流水线、多个机器学习模型流水线的集合体、或它们的组合以及对应的元数据。可以从机器学习模型流水线、多个机器学习模型流水线的集合体、或它们的组合中提取元数据。可以生成机器学习模型流水线、多个机器学习模型流水线的集合体或它们的组合、以及所提取的元数据的交互式可视化图形用户界面。

使用超参数预测器提高自动机器学习模型选择的准确度-202080038456.0
发明人： H·F·莫汉达姆;S·阿格尔沃;V·瓦拉达拉珍;A·雅科夫列夫;S·伊蒂库拉;N·阿格尔沃 -专利权人：甲骨文国际公司
申请日： 2020-04-02 - 公布日： 2022-02-01 - 主分类号： G06N20/20
摘要：在实施例中，对于多个微型机器学习模型(MML模型)中的每个MML模型，训练预测第一数据集的相应超参数设置集的相应超参数预测器集。每个MML模型表示多个参考机器学习模型(RML模型)中的相应RML模型。从第一数据集生成第一多个数据集样本。生成第一多个第一元特征集。使用超调算法为所述每个MML模型生成相应的超参数设置目标集。第一多个第一元特征集和相应的超参数设置目标集用于训练相应的超参数预测器集。每个超参数预测器集用于提高为每个数据集选择RML模型的准确度。

基于元学习的自动特征子集选择-202080028693.9
发明人： T·卡那格尔;S·伊蒂库拉;H·F·莫汉达姆;N·阿格尔沃 -专利权人：甲骨文国际公司
申请日： 2020-03-30 - 公布日： 2021-12-14 - 主分类号： G06N20/20
摘要：本发明涉及机器学习(ML)模型的降维。本文中的技术是对特征进行单独排名并基于其排名对特征进行组合以实现特征的最优组合，该最优组合可以加速训练和/或推理、防止过度拟合和/或提供对在某种程度上神秘的数据集的洞察。在实施例中，计算机对训练语料库的数据集的特征进行排名。对于每个数据集和每个界标百分比，目标ML模型被配置为仅接收特征中的排名最高的界标百分比的特征，并且测量通过使用数据集训练ML模型实现的界标准确度。基于数据集的界标准确度和元特征值，为每个数据集生成相应的训练元组。基于所有训练元组，对回归器进行训练以预测用于训练目标ML模型的最优特征数量。

用于分类和意图确定的多模型结构-202080028839.X
发明人：王昱;沈逸麟;邓岳;金红霞 -专利权人：三星电子株式会社
申请日： 2020-03-20 - 公布日： 2021-11-23 - 主分类号： G06N20/20
摘要：基于一个或多个多模型结构的意图确定可以包括响应于接收到的输入从多个领域特定模型中的每一个生成输出。领域特定模型可以包括使用针对每个领域特定模型的相应局部损失度量和针对所述多个领域特定模型的全局损失度量而训练的经同时训练的机器学习模型。可以通过对每个领域特定模型的输出进行分类来确定与一个或多个领域特定模型相对应的意图的存在与否。

用于具有可编程人机混合集成学习的预报警报的系统和方法-201980094466.3
发明人：阿鲁纳·贾马拉马达卡;大卫·J·休柏;山缪·D·强森;采青·卢 -专利权人： HRL实验室有限责任公司
申请日： 2019-12-13 - 公布日： 2021-11-05 - 主分类号： G06N20/20
摘要：一种用于计算人机混合集成预测的方法，包括：接收个别预报问题[IFF]；将IFF分类到多个典型问题主题中的一个；标识与所述典型问题主题相关联的机器模型；对于所述机器模型中的每一机器模型：从多个人类参与者中的一个人类参与者接收：第一任务输入，包括对训练数据集的选择；第二任务输入，包括对所选择的训练数据集的部分的选择；以及第三任务输入，包括用于配置所述机器模型的模型参数；根据所述第一、第二和第三任务输入训练所述机器模型；以及基于所训练的机器模型计算机器模型预报；从由所述机器模型计算的机器模型预报来计算聚合预报；以及响应于确定所述聚合预报满足阈值条件而发送警报。

使用深度学习多预测器融合和贝叶斯优化的轨迹预测-201980091937.5
发明人： M·德姆林;葛垚;N·霍瑟;徐高伟 -专利权人：宝马股份公司
申请日： 2019-02-15 - 公布日： 2021-09-21 - 主分类号： G06N20/20
摘要：本公开的各示例描述了一种用于轨迹预测的方法、装置和车辆。该方法包括：获取针对对象的观察数据以及与该对象相关的环境信息；利用多个预测器基于历史观察数据给出针对该对象的相应预测；将相应预测和环境信息馈入用于轨迹预测的经训练多预测器融合模型中；由该多预测器融合模型提供在由该环境信息指示的环境下的针对该对象的预测轨迹。

自动化机器学习的高效配置选择-201980054858.7
发明人：王篪;黄思露;S·乔杜里;丁博麟 -专利权人：微软技术许可有限责任公司
申请日： 2019-06-28 - 公布日： 2021-07-23 - 主分类号： G06N20/20
摘要：在自动化机器学习中，可以通过以下方式在多个候选机器学习配置中选择近似最佳配置：逐步采样训练和测试数据集以用于配置的迭代训练和测试，同时基于相应性能的相关联的估计置信区间来逐步剪枝候选配置集合。

用于减少机器学习中的数据存储的系统和方法-201980018626.6
发明人：马渕充启 -专利权人：丰田研究所股份有限公司
申请日： 2019-02-14 - 公布日： 2021-06-04 - 主分类号： G06N20/20
摘要：公开了用于通过用多个二维图像替换三维模型来减少用于机器学习的训练数据所必需的数据存储量和/或处理能力的方法和系统。该方法包括从三维模型确定感兴趣的对象，并将感兴趣的对象裁剪为多个二维图像。裁剪多个二维图像使得仅保留感兴趣的对象。针对诸如道路宽度、道路角度或关于相邻车辆的角度之类的特定属性来裁剪多个二维图像。图像捕获设备捕获实时背景图像。使用相关联的属性对背景图像内的对象进行分类。将属性与多个二维图像合成，使得生成具有实时背景的3D模型的多个副本二维图像。

使用特征排名和可扩展的自动搜索进行自动特征子集选择-201980067625.0
发明人： T·卡那格尔;S·伊蒂库拉;N·阿格尔沃 -专利权人：甲骨文国际公司
申请日： 2019-10-01 - 公布日： 2021-05-25 - 主分类号： G06N20/20
摘要：本发明涉及用于机器学习(ML)模型的降维。本文中的技术是对特征进行单独排名并基于其排名组合特征以实现特征的最佳组合，该组合可以加速训练和/或推理、防止过度拟合和/或提供对在某种程度上神秘的数据集的洞察。在实施例中，对于训练数据集的每个特征，计算机基于相关性评分函数和在训练数据集中出现的特征的值的统计信息计算相关性得分。为每个特征计算基于特征的相关性得分的排名。基于特征的排名，生成特征的不同子集的序列。对于不同特征子集的序列中的每个不同子集，基于训练针对不同子集配置的机器学习(ML)模型来生成适合度得分。

自动化的本地化机器学习训练-201880086373.1
发明人： K·L·基梅尔;J·B·赫斯基思;E·L·琼斯;J·L·南斯;L·T·史密斯 -专利权人：微软技术许可有限责任公司
申请日： 2018-12-20 - 公布日： 2020-08-28 - 主分类号： G06N20/20
摘要：用于生成机器学习模型以从物理传感器数据中检测事件实例的技术，包括：将第一机器学习模型应用于来自一位置处的第一物理传感器的第一传感器数据以检测事件实例，确定使用该第一机器学习模型的性能度量不在期望参数范围内，在一时间段期间从与该第一物理传感器相同位置处的第二物理传感器获得第二传感器数据，在该时间段期间从该第一物理传感器获得第三传感器数据，通过基于使用该第二传感器数据检测到的训练事件实例选择该第三传感器数据的各部分来生成因位置而异的训练数据，使用该因位置而异的训练数据来训练第二ML模型，以及应用该第二ML模型而非该第一ML模型来检测事件实例。

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]使用加权训练数据的机器学习模型的多阶段训练技术在审

专利文献下载