[发明专利]学习装置和学习方法在审
申请号: | 201780078843.5 | 申请日: | 2017-12-14 |
公开(公告)号: | CN110088779A | 公开(公告)日: | 2019-08-02 |
发明(设计)人: | 中田健人;成平拓也;铃木洋贵;大里章人 | 申请(专利权)人: | 索尼公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;李彦丽 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开内容涉及一种学习装置和学习方法,利用所述学习装置和学习方法可以基于用户输入来容易地校正强化学习模型。显示控制部使显示部显示与强化学习模型相关的强化学习模型信息。校正部基于来自用户的关于强化学习模型信息的输入来校正强化学习模型。本公开内容可以应用于例如个人计算机PC,其基于来自用户的输入来校正强化学习模型并且通过强化学习、使用经校正的强化学习模型来学习代理体的移动策略。 | ||
搜索关键词: | 强化学习 校正 学习装置 模型信息 个人计算机PC 学习 显示控制部 移动策略 代理体 校正部 应用 | ||
【主权项】:
1.一种学习装置,包括:显示控制部,被配置成使显示部显示关于强化学习模型的强化学习模型信息;以及校正部,被配置成基于对所述强化学习模型信息的用户输入来校正所述强化学习模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201780078843.5/,转载请声明来源钻瓜专利网。
- 同类专利
- 线性模型稳定学习方法和装置-201910627533.5
- 崔鹏;沈哲言 - 清华大学
- 2019-07-12 - 2019-11-12 - G06N20/00
- 本发明提出一种线性模型稳定学习方法和装置,其中,方法包括:对自变量的初始矩阵的每一列数据进行随机重采样,并根据采样结果生成最终矩阵;将第一样本标签赋予初始矩阵,并将第二样本标签赋予最终矩阵,生成概率二分类器;以及通过概率二分类器并应用概率密度比估计算法得到新的样本权重,并根据新的样本权重调整样本权重,以消除自变量之间的共线性,生成最终线性回归模型。本发明实施例的方法,通过线性模型稳定方法学习,实现消除自变量之间的共线性的目的,提高了模型的拟合精度,进而能够在多变的数据分布下保持稳定的预测性能。
- 一种资源信息处理方法、装置及设备-201910748139.7
- 傅桔选;尹方亮 - 腾讯科技(深圳)有限公司
- 2019-08-14 - 2019-11-12 - G06N20/00
- 本申请涉及一种资源信息处理方法、装置及设备,所述方法包括:获取至少一项目标资源信息,以及每项目标资源信息的当前数据;将每项目标资源信息的当前数据分别输入到至少两个资源信息预测模型进行预测,得到与每项目标资源信息对应的至少两项资源预测信息;其中所述至少两个资源信息预测模型是与至少两个预设时间段分别对应的;基于与各项目标资源信息对应的所述资源预测信息,确定各项目标资源信息的目标预测信息;本申请能够通过不同时间段所对应的不同预测模型对目标资源信息分别进行预测,并综合各预测模型的预测信息来确定目标资源信息最终的预测结果,对于样本非同分布的数据能够获得准确的预测结果。
- 一种联邦学习方法及装置-201910757743.6
- 程勇;蔡杭;刘洋;陈天健 - 深圳前海微众银行股份有限公司
- 2019-08-16 - 2019-11-12 - G06N20/00
- 本发明公开了一种联邦学习方法及装置,该方法适用于包括多个参与者的联邦学习,其中,所述多个参与者的训练数据集之间包含有不同的样本对象及相同的数据特征;所述多个参与者根据所述多个参与者的属性信息被预划分为多个参与组;其中,每个参与组对应不同的上传时间段;所述上传时长是参与者进行模型参数更新并将获得的模型参数更新发送至协调者所耗时长;其中方法为:所述协调者获取目标参与组中各参与者上传的模型参数更新;协调者根据所述一个或者多个参与组中的参与者上传的模型参数更新对联邦学习模型参数进行更新。上述方法应用于金融科技(Fintech)时,提升了联邦学习模型的精确性。
- 基于非监督机器学习算法的状态分析方法及其应用模块-201910815181.6
- 冯文昕;李道豫;邱志远;谭劲;任淘;周培;刘浩;邢方勃;姚纳;汤勇;王瑾;朱楚伟;黄波 - 中国南方电网有限责任公司超高压输电公司贵阳局;南京邮电大学
- 2019-08-30 - 2019-11-12 - G06N20/00
- 本发明公开了一种基于非监督机器学习算法的状态分析方法,包括以下步骤:1、对远端模块进行编号;2、对远端模块的输出信号进行采集;3、对采集到的远端模块的输出信号进行整理,建立样本点集合,并将所采集的远端模块的输出信号与样本点集合中的点一一对应;4、将样本点集合中的点代入非监督机器学习算法,以判定远端模块的工作状态。本发明还公开了一种实现所述基于非监督机器学习算法的状态分析方法的应用模块,包括:能量管理装置、模拟信号采集装置和数字信号处理装置。具有解决了正向和反向的样本无法获取的问题,弥补了无法采用有监督机器学习算法进行故障建模和工作状态预判的不足等优点。
- 一种三模型博弈的产生式对抗网络模型的建立方法及装置-201710381332.2
- 朱军;李崇轩;许堃;张钹 - 清华大学
- 2017-05-25 - 2019-11-12 - G06N20/00
- 本发明实施例提供一种三模型博弈的产生式对抗网络模型的建立方法及装置。所述方法包括:初始化分类子模型、生成子模型和判别子模型;根据获取的图像‑类别数据集、无类别图像数据集和类别信息集构成训练数据集合;对第一参数目标函数、第二参数目标函数和第三参数目标函数进行优化,获得优化后判别子模型、优化后分类子模型、优化后生成子模型;优化后判别子模型、优化后分类子模型和优化后生成子模型即为产生式对抗网络模型。所述装置用于执行所述方法。本发明实施例通过训练数据集合分别优化判别子模型、分类子模型和生成子模型中的参数,所得优化后的产生式对抗网络模型在半监督情况下显著提高了分类准确率并具有产生特定类别图片的能力。
- 一种基于多智能体深度强化学习算法的智能博弈系统-201910474339.8
- 程茹茹;高阳 - 南京大学;江苏万维艾斯网络智能产业创新中心有限公司
- 2019-05-31 - 2019-11-08 - G06N20/00
- 本发明公开了一个基于多智能体深度强化学习的智能博弈系统,利用多智能体深度强化学习算法构建决策对象软件模型及智能决策技术,软件可以表征智能博弈的特点,能够进行博弈、有胜负,并可以展示智能博弈的过程。
- 联邦学习模型训练方法、装置、终端设备及存储介质-201910733943.8
- 程勇;李苏毅;刘洋;陈天健 - 深圳前海微众银行股份有限公司
- 2019-08-08 - 2019-11-08 - G06N20/00
- 本发明公开了一种联邦学习模型训练方法、装置、终端设备及存储介质,该联邦学习模型训练方法包括:获取各所述客户端所拥有的训练数据的数据特征;根据所述数据特征在各所述客户端生成相同特征维度的代用数据;基于各所述客户端所拥有的所述训练数据与所述代用数据进行联邦学习模型训练。本发明解决了纵向联邦学习对联邦学习模型进行模型训练时,整体计算复杂度高,并且各参与者之间通信开销大,从而造成联邦学习的应用场景受限的技术问题。
- 服务器装置、已学习模型提供程序、已学习模型提供方法以及已学习模型提供系统-201780088565.1
- 河合圭悟;比户将平;久保田展行;田中大辅 - 首选网络株式会社
- 2017-03-21 - 2019-11-08 - G06N20/00
- 一种服务器装置,能够与具备使用已学习模型进行处理的学习器的至少1个以上的设备经由通信网络进行通信,其中,所述服务器装置具备:存储部,存储与各种设备的环境、条件匹配地预先进行学习而得到的多个共用模型;设备数据获取部,从所述设备获取包括环境、条件的信息的设备数据;对象共用模型选择部,根据获取到的设备数据选择对该设备最佳的共用模型;以及发送部,对该设备发送选择出的共用模型。
- 状态预测装置和状态预测控制方法-201880012012.2
- 上岛利明 - 株式会社日立信息通信工程
- 2018-02-26 - 2019-11-08 - G06N20/00
- 本发明提供状态预测装置和状态预测控制方法。状态预测装置(100)具有:学习数据生成部(212),其以规定的时间间隔取得由观测传感器(300)得到的测量数据,按观测对象的每个动作模式进行划分,生成学习数据;聚类部(213),其将规定数量的所述学习数据分类为预先决定的类别并赋予标签,生成了监督式数据;学习部(214),其在学习算法中输入监督式数据并进行学习,生成学习完毕模型(252),并且生成各类别的代表数据;时序模型生成部(215),其按照该学习数据的生成顺序对在预先决定的模型生成单位期间内赋予学习数据的标签(244)时序地进行排列,生成时序模型(273);以及预测部(220),其使用时序模型(273),根据新取得的测量数据来算出预测值。
- 一种用于深度学习框架分布式训练的方法和装置-201910631463.0
- 王文潇 - 苏州浪潮智能科技有限公司
- 2019-07-12 - 2019-11-05 - G06N20/00
- 本发明公开了一种用于深度学习框架分布式训练的方法。该方法包括:根据IP地址文件中存储的各个容器的IP地址,将在分布式训练中使用的各种类型的节点分别分配到各个容器中,并且配置每个容器的中的训练参数;采用在各个容器中的节点来运行分布式训练的相应的进程。通过上述方式,可以使用容器的方式来部署运行分布式训练的节点,然后通过设置容器的端口地址,可以在一台服务器中部署多个容器,从而在总体上减少了进行深度学习框架分布式训练所使用的服务器的总数,节约分布式训练所使用的服务器硬件资源,并且节约运行服务器所需的电力资源。还公开了对应的用于深度学习框架分布式训练的装置。
- 信息分析方法、装置、服务器及存储介质-201910690865.8
- 管基月 - 卓尔智联(武汉)研究院有限公司
- 2019-07-29 - 2019-11-05 - G06N20/00
- 本发明实施例适用于信息技术领域,提供了一种信息分析方法、装置、服务器及存储介质,其中,信息分析方法包括:根据各个信息系统上传的训练数据,进行联邦学习以确定包含至少两个字段变量的联邦模型,所述训练数据基于所述信息系统的信息数据训练得到,所述信息数据由至少两个字段变量对应的字段值组成;基于所述联邦模型,对至少一个字段变量进行置信区间估计,得到至少一个置信区间;基于所述至少一个置信区间,确定各信息数据中对应的字段值异常或正常,以基于异常的字段值进行分析。
- 一种机器学习模型线上更新方法及装置-201910720677.5
- 裴洪斌;游龙翔;丁凯文;饶彭彦 - 中国工商银行股份有限公司
- 2019-08-06 - 2019-11-05 - G06N20/00
- 本发明提供一种机器学习模型线上更新方法及装置,所述方法包括:接收至少一个输入参数的参数值,所述输入参数是预设的;根据所述至少一个输入参数的参数值和线上模型对应的场景模板,更新所述线上模型;其中,所述输入参数与所述线上模型对应的场景模板的至少一个模型参数对应,所述线上模型对应的场景模板是预先获得的。所述装置用于执行上述方法。本发明实施例提供的机器学习模型线上更新方法及装置,提高了线上模型的更新效率。
- 融入情绪因素的贝叶斯网络学习风格初始化及修正算法-201810345695.5
- 宋彩霞;王瑞坤;陈龙猛;宋笑笑;翟慧超 - 青岛农业大学
- 2018-04-18 - 2019-11-01 - G06N20/00
- 本发明公开了一种融入情绪因素的贝叶斯网络学习风格初始化及修正算法,包括简单问题初始化模块、基本信息初始化模块、学习情绪因素模块、学习行为概率模块、条件概率表初始化及修正模块和贝叶斯网络修正模块;所述简单问题初始化模块使用简单问题初始化学习风格;所述基本信息初始化模块通过基本信息初始化学习风格;所述学习情绪因素模块让学习者选择情绪因素的权值确定当前情绪;所述学习行为概率模块是计算学习行为概率的过程;所述条件概率表初始化及修正模块完成初始化和修正条件概率表;所述贝叶斯网络修正模块进行修正学习风格。通过上述方式,本发明能快速准确地完成学习风格的初始化和修正,为自适应学习系统推荐学习路径做基础。
- 一种强化学习的高效探索方法-201910549586.X
- 张寅;胡滨 - 浙江大学
- 2019-06-24 - 2019-10-29 - G06N20/00
- 本发明公开了一种强化学习的高效探索方法,该方法的步骤如下:1)预训练计数估计函数;2)利用预训练的计数估计函数进行强化学习的高效探索。本发明主要针对强化学习中探索与利用的平衡问题,在连续空间任务中,通过预训练计数估计函数估计智能体所遇到的状态的出现次数,利用状态的出现次数计算奖赏,通过奖赏引导智能体探索那些较少遇到的状态从而实现高效探索。本发明通过使用独立的探索策略处理奖赏信号,避免了奖赏信号对智能体行动策略的影响,使得探索过程更稳定。
- 部署在模拟平台上的用于训练机器学习模型的系统和方法-201811384514.6
- 张亮亮;余思洋;李栋;胡江滔;陶佳鸣;蒋一飞 - 百度(美国)有限责任公司
- 2018-11-20 - 2019-10-25 - G06N20/00
- 公开了用于训练机器学习模型的系统和方法。在一个实施方式中,对于多个驾驶场景的每个,响应于来自车辆的一个或多个传感器的传感器数据和驾驶场景,在车辆由人类驾驶员根据驾驶场景驾驶的同时收集车辆的驾驶统计数据和环境数据。在完成驾驶场景后,驾驶员被请求为完成的驾驶场景选择标签并且所选择的标签响应于驾驶员的选择被存储。基于预定标准从驾驶统计数据和环境数据提取特征。所提取的特征包括在驾驶场景期间在不同时间点收集的驾驶统计数据的一些和环境数据的一些。
- 一种基于注意力机制的空洞卷积空间金字塔池化上下文学习方法-201910351669.8
- 王吴凡;朱纪洪;匡敏驰;陈吕劼;闫星辉 - 清华大学
- 2019-04-28 - 2019-10-25 - G06N20/00
- 本发明公开了一种基于注意力机制的空洞卷积空间金字塔池化上下文学习方法,特征是包含:空洞卷积空间金字塔池化模型和注意力模型。所述空洞卷积空间金字塔池化模型由多条带有不同扩张率的空洞卷积通路并联组成,用于提取多尺度上下文信息。所述注意力模型通过非线性函数表征不同通道上下文信息之间的关系,进而对各个通道的多尺度信息分配权重。本发明的基于注意力机制的空洞卷积空间金字塔池化上下文学习方法可以增强空洞卷积空间金字塔池化模型的上下文特征学习能力,并能灵活嵌入到神经网络模型中,适用于图像语义分割、目标检测、图像分类等多种任务,适用于推广应用。
- 客户端变化的联邦训练方法、装置、训练终端及存储介质-201910663301.5
- 黄安埠 - 深圳前海微众银行股份有限公司
- 2019-07-22 - 2019-10-25 - G06N20/00
- 本发明公开了一种客户端变化的联邦训练方法,通过检测参与本轮联邦迭代训练的客户端是否发生变化;当检测到参与本轮联邦迭代训练的客户端发生变化时,获取所述客户端发生变化的变化类型;根据所述变化类型,确定本轮联邦迭代训练的目标全局模型;根据所述目标全局模型,进行本轮联邦迭代训练,以得到待训练的联邦学习模型的最终参数。本发明还公开了一种客户端变化的联邦训练装置、训练终端以及存储介质。本发明解决了参与联邦的训练客户端变化时,采用现有的联邦训练方法得到的最终模型参数可靠性低的技术问题。
- 基于云平台的决策方法和系统-201811536784.4
- 高超 - 启元世界(北京)信息技术服务有限公司
- 2018-12-14 - 2019-10-25 - G06N20/00
- 本发明属于人工智能技术领域,其公开了一种基于云平台的决策方法和系统。方法包括接收接收模拟训练请求;配置硬件资源,初始化模拟引擎、决策引擎和学习引擎;决策引擎根据由模拟引擎生成的模拟环境状态和初始模型得到作用于模拟环境中的指令,循环执行多次,得到模拟训练集;学习引擎根据模拟训练集训练初始模型,得到更新后的初始模型;发送终端设备初始化请求,终端设备初始化请求包括硬件资源和更新后的初始模型,且用于使终端设备配置硬件资源并根据真实环境的状态输出作用于真实环境的指令。系统包括第一调度装置、模拟引擎、决策引擎、学习引擎和第二调度装置。本发明通过上述方案形成了完整的决策闭环,达到了符合预期的决策目的。
- 执行机器学习的分布式系统及其方法-201710764494.4
- 陈雨强;杨强;戴文渊;焦英翔;涂威威;石光川 - 第四范式(北京)技术有限公司
- 2017-08-30 - 2019-10-25 - G06N20/00
- 提供了一种执行机器学习的分布式系统及其方法,所述系统包括:多个计算装置,其中,每个计算装置被配置为针对各自的数据记录来执行数据流式计算,其中,所述数据流式计算表示为一个或多个有向无环图;参数存储器,用于维护机器学习模型的参数,其中,在执行训练机器学习模型的数据流式计算时,计算装置利用从参数存储器获取的参数来针对各自的数据记录执行关于机器学习模型训练的运算,并且,参数存储器根据计算装置的运算结果来更新所述参数;并且/或者,在执行利用机器学习模型进行预估的数据流式计算时,计算装置利用从参数存储器获取的参数来针对各自的数据记录执行关于机器学习模型预估的运算。由此,可减少机器学习的运算开销。
- 定位模型构建方法、装置、计算机设备和存储介质-201910526952.X
- 施奕明;江琳;蔡健;赵云松 - 深圳壹账通智能科技有限公司
- 2019-06-18 - 2019-10-22 - G06N20/00
- 本申请涉及一种定位模型构建方法、装置、计算机设备和存储介质。涉及人工智能领域。所述方法包括:从第三方平台中获取用户轨迹图与定位点之间的关联关系,所述关联关系是在设定场景下通过人机交互过程中产生的;根据所述关联关系生成带有定位标注的训练样本,所述用户轨迹图为训练样本,与所述用户轨迹图关联的所述定位点为定位标注;获取预先定义的机器学习模型;将所述训练样本输入至所述机器学习模型中进行模型训练,生成定位模型;将所述定位模型更新到基于位置的平台中。采用本方法能够克服人工标记难度。
- 端到端建模方法及系统-201611070244.2
- 潘嘉;张仕良;熊世富;魏思;胡国平 - 科大讯飞股份有限公司
- 2016-11-29 - 2019-10-18 - G06N20/00
- 本发明公开了一种端到端建模方法及系统,该方法包括:确定基于目标的端到端模型的拓扑结构,所述拓扑结构包括:输入层、编码层、强化编码层、过滤层、解码层、输出层;所述强化编码层用于对所述编码层输出的特征序列加入目标单元信息,所述过滤层用于对所述强化编码层加入所述目标单元信息后的特征序列进行信息过滤;收集大量训练数据;确定所述训练数据的标注对象,并对所述标注对象中的目标单元进行标注;提取所述训练数据的特征序列;利用所述训练数据的特征序列及其目标单元的标注信息对基于目标的端到端模型的参数进行训练,得到基于目标的端到端模型参数。利用本发明,可以提高建模的准确度。
- 运营管理方法及运营管理系统-201810263581.6
- 中岛淳 - 株式会社日立制作所
- 2018-03-28 - 2019-10-15 - G06N20/00
- 本发明提供一种运营管理方法及运营管理系统,对包括多个构成要素的计算机系统的运营进行管理。实际构成提取步骤根据计算机系统的构成信息,提取计算机系统中的符合已保持的通用规则所表示的关联的实际构成。展开规则生成步骤基于提取的实际构成,根据通用规则生成与实际构成对应的展开规则。学习单位决定步骤基于生成的展开规则,决定学习单位。由此,通过使用基于性能依赖关系的通用规则,不需要由管理者决定应利用何种度量架构预测模型,而能够快速地自动决定以何种度量和构成单位来进行机器学习,能够减少后续处理中建立预测模型所花费的时间。
- 基于交叉验证的标签补全方法、终端、装置及存储介质-201910622809.0
- 康焱;刘洋;陈天健;杨强 - 深圳前海微众银行股份有限公司
- 2019-07-10 - 2019-10-15 - G06N20/00
- 本发明公开了一种基于交叉验证的标签补全方法,包括以下步骤:第一终端基于第一样本、所述第一样本对应的第一标签以及第二样本生成所述第二样本对应的待校对标签,而后所述第一终端基于所述第二样本、所述待校对标签以及交叉验证算法确定所述第二样本对应的目标标签。本发明还公开了一种装置、终端及存储介质。本发明解决了标签对本地判别模型的偏执,提升了机器模型的性能和标签补全的准确性,同时保证了各终端数据的安全性。
- 信息处理设备、信息处理方法及程序-201880012459.X
- 饭田纮士;高松慎吾 - 索尼公司
- 2018-11-30 - 2019-10-11 - G06N20/00
- [问题]提出了一种能够更适当地指定用于利用预测模型进行的预测的基础的机制。[解决方案]一种信息处理设备包括:控制单元,其被配置成从输入至作为非线性模型的预测模型的输入数据的特征量之中提取对利用预测模型进行的预测的结果有正面贡献的第一特征量以及对所述结果有负面贡献的第二特征量。
- 一种网络模型训练方法和装置-201910527781.2
- 张文迪;崔正文 - 北京奇艺世纪科技有限公司
- 2019-06-18 - 2019-10-08 - G06N20/00
- 本发明实施例提供了一种网络模型训练方法和装置,方法包括:将预设训练样本集中的训练样本,分别输入至目标网络模型所包含的各子网络模型,获取各子网络模型各自的损失函数的数值,以及原始损失函数的数值,其中,一个子网络模型的损失函数用于表示该子网络模型的实际输出结果与期望输出结果之间的差值,原始损失函数用于表示目标网络模型的实际输出结果与期望输出结果之间的差值,根据各子网络模型各自的损失函数的数值,以及原始损失函数的数值,对目标网络模型的模型参数进行调整,当达到预设停止训练条件时,停止模型训练,得到训练好的目标网络模型。基于上述处理,能够提高训练好的网络模型的有效性。
- 横向联邦学习方法、装置、设备及计算机存储介质-201910597883.1
- 程勇;衣志昊;吴文霞;刘洋;陈天健 - 深圳前海微众银行股份有限公司
- 2019-07-03 - 2019-10-08 - G06N20/00
- 本发明涉及人工智能金融科技(Fintech)技术领域,并公开了一种横向联邦学习方法,该方法包括:在进行横向联邦学习时,目标参与者发送第一数据特征集合到横向联邦学习中的协调者,其中,所述协调者接收多个参与者发送的第二数据特征集合,并基于所述第二数据特征集合生成总数据特征集合,所述多个参与者包括目标参与者;所述目标参与者接收所述协调者反馈的所述总数据特征集合,并根据所述总数据特征集合确定所述目标参与者的目标数据特征集合;所述目标参与者根据所述目标数据特征集合进行模型训练。本发明还公开了一种横向联邦学习装置、设备和一种计算机存储介质。本发明提高了横向联邦学习构建的联合模型的质量。
- 用于处理机器学习方法的参数的方法以及重建方法-201910222703.1
- 埃里克·福涅尔 - 西门子医疗保健有限责任公司
- 2019-03-22 - 2019-10-01 - G06N20/00
- 一种用于处理机器学习方法(L)的参数(P)的方法,所述机器处理方法用于提供在记录CT图像数据集时运动的对象(2)的CT图像数据集(CB)的运动校正的校正数据集(KD),其中提供具有多个参考图像数据集(RD)的训练数据集(T),用于导入机器学习方法(L)中,其中执行迭代(110),其中在其每个迭代步骤中,借助于机器学习方法(L)为每个参考图像数据集(RD)确定校正数据集(KD),并且求出与在该迭代步骤中确定的校正数据集(KD)有关的成本函数(CF)的结果(E),和其中根据成本函数(CF)的结果(E)结束迭代(110)或改变机器学习方法(L)的参数(P)。此外,涉及一种重建方法,所述重建方法使用经处理的机器学习方法(L)。
- 一种在机器学习中调整模型参数的方法及装置-201910588359.8
- 龚俊衡;徐莹 - 成都品果科技有限公司
- 2019-07-01 - 2019-10-01 - G06N20/00
- 本发明公开一种在机器学习中调整模型参数的方法及装置,包括:获取输入数据;所述输入数据中包括数据标签;判断所述数据标签的数据类型;根据所述数据类型,选取待训练的网络模型,并选取用于优化所述网络模型的损失函数;根据当前策略选取所述网络模型的模型参数;采用所述模型参数训练所述网络模型,并根据所述损失函数计算损失值;将所述损失值作为当前策略的奖励;根据所述奖励更新当前策略,并循环执行上述训练步骤,直至当前策略收敛。本发明提供的技术方案,能够有目标地对参数进行查找,从而缩短参数调整时间、提高工作效率。
- 数据处理方法、装置、存储介质及处理器-201910491095.4
- 李玮巍;吴明璞;李刚毅 - 博彦科技股份有限公司
- 2019-06-06 - 2019-09-27 - G06N20/00
- 本发明公开了一种数据处理方法、装置、存储介质及处理器。其中,该方法包括:监测流数据,确定流数据中的历史数据和更新数据,其中,更新数据处于更新时间窗口内,历史数据处于历史时间窗口内;根据历史数据训练历史机器学习模型;根据更新数据训练更新机器学习模型;根据历史机器学习模型和更新机器学习模型,生成有效机器学习模型,其中,有效机器学习模型用于对流数据进行处理。本发明解决了无法根据流数据对机器模型进行自动更新的技术问题。
- 一种基于形式向量的不一致决策信息系统规则提取方法-201910508377.0
- 陈泽华;延安;尚子豪;闫心怡 - 太原理工大学
- 2019-06-12 - 2019-09-27 - G06N20/00
- 本发明提供了一种基于形式向量的不一致决策信息系统规则提取方法,首先把不一致决策信息系统转化为一致决策信息系统,简化了不确定性规则提取过程。将粗糙集理论引入形式背景,以决策形式背景为研究对象,定义并讨论了形式向量及其性质。引入粒度的思想,由粗到细求取不同粒度空间下的形式向量,基于形式向量构建树形拓扑图,通过条件形式向量与决策形式向量的关系给出了不一致规则约简定理,提出了基于形式向量的不一致决策信息系统规则快速提取算法,并通过实验验证了算法的有效性和快速性。
- 专利分类