[发明专利]一种基于深度蒙特卡洛树搜索的边缘计算任务分配方法在审
申请号: | 201910741439.2 | 申请日: | 2019-08-12 |
公开(公告)号: | CN110427261A | 公开(公告)日: | 2019-11-08 |
发明(设计)人: | 陈杰男;陈思宇;李帅;王琪 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F9/50;G06N3/04;G06N3/08;G06Q10/04 |
代理公司: | 四川力久律师事务所 51221 | 代理人: | 钟尉 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 边缘服务器 资源分配 强化学习算法 任务分配 树搜索 算法 移动设备终端 资源调度模块 计算系统 能量消耗 任务卸载 贪婪搜索 移动终端 优化服务 时延 优化 输出 移动 协作 申请 服务 | ||
1.一种基于深度蒙特卡洛树搜索的边缘计算任务分配方法,其特征在于,所述方法包括:
步骤一:边缘服务器更新移动边缘计算系统状态信息;所述移动边缘计算系统状态信息包括:边缘服务器的计算资源情况、无线通信基站与移动终端的通信资源情况,以及移动设备的任务请求信息;所述任务请求信息包括:每个移动设备终端和无线通信基站的信道增益信息、当前待处理的任务的数据量大小、移动设备终端完成当前任务所需的CPU时钟周期数,以及移动设备终端CPU时钟频率;
步骤二:边缘服务器将移动边缘计算系统状态信息传输到DNN、MCTS和LSTM;所述LSTM根据移动设备终端和无线通信基站的信道增益预测未来信道增益,并将得到的信道增益预测数据发送到MCTS和DNN;所述DNN根据移动边缘计算系统状态信息和信道增益预测数据得到资源分配动作先验概率,将得到的资源分配动作先验概率发送给MCTS;
步骤三:MCTS根据所述移动边缘计算系统状态信息、信道增益预测数据和资源分配动作先验概率进行搜索,得到最优资源分配方案;并将所述最优资源分配方案发送给移动设备终端,移动设备终端将任务卸载给移动边缘计算系统执行模块,移动边缘计算系统执行模块根据最优资源分配方案执行最优资源分配行为。
2.根据权利要求1所述的一种基于深度蒙特卡洛树搜索的边缘计算任务分配方法,其特征在于,预先对所述DNN进行训练,使其满足:当有移动边缘计算系统状态信息和信道增益预测数据输入时,能够输出资源分配动作先验概率给MCTS。
3.根据权利要求1所述的一种基于深度蒙特卡洛树搜索的边缘计算任务分配方法,其特征在于,步骤三中所述搜索包括以下步骤:
s1:MCTS根据移动边缘计算系统状态初始化根节点;
s2:将根节点设置为搜索起点进行下一次搜索;
s3:判断是否完成预定次数的搜索,若是,执行步骤s9,若否,则执行步骤s4;
s4:判断当前节点是否为叶子节点,若是,执行步骤s5,若否,则执行步骤s6;
s5:进入到叶子节点后,即计算资源分配完成后,评估该资源分配方案,返回奖赏,根据奖赏更新该条路径上所有节点的状态;
s6:判断当前节点是否为已全扩展节点,若否,执行步骤s7,若是,则执行步骤s8;
s7:根据DNN的输出的资源分配动作先验概率扩展当前节点的所有子节点,并根据公式选择下一节点,其中Q(v′k)定义为节点v′k的累积奖励值,N(v′k)定义为节点v′k的访问次数,e为平衡算法开发探索的比例系数,p(v′k|sk)表示下一节点的先验概率,k表示当前节点的层数;
s8:从所有可能的资源分配动作中选取搜索价值最高的动作,执行选择的动作进入下一层结点;
s9:输出访问次数最多的路径为最优的资源分配方案。
4.根据权利要求1所述的一种基于深度蒙特卡洛树搜索的边缘计算任务分配方法,其特征在于,利用所述步骤三中MCTS搜索得到的最优资源分配方案训练所述DNN,以提高所述DNN的预测准确率,使DNN输出更新后的资源分配动作先验概率更好地指导MCTS进行搜索,优化所述边缘计算任务分配方法。
5.根据权利要求1所述的一种基于深度蒙特卡洛树搜索的边缘计算任务分配方法,其特征在于,所述DNN包含一个输入层Hi,n个公共隐藏层{H1,…,Hn},以及q个分裂子层,每个分裂子层包含m个子隐藏层每层的神经元个数表示为神经网络每层的参数为其中i表示输入层,s表示子隐藏层,O表示输出层,W表示权重,b表示偏置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910741439.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:主机作业调度方法、装置及系统
- 下一篇:一种基因数据分析方法及异构调度平台