![一种基于课程学习的多智能体深度强化学习方法和装置](/CN/2023/1/205/images/202311029693.jpg)
基本信息:
- 专利标题: 一种基于课程学习的多智能体深度强化学习方法和装置
- 申请号:CN202311029693.2 申请日:2023-08-16
- 公开(公告)号:CN116739077B 公开(公告)日:2023-10-31
- 发明人: 李敏 , 宋南骏 , 曾祥光 , 罗仕杰 , 张加衡 , 张童伟 , 张森 , 张越龙 , 潘云伟 , 邢丽静 , 黄傲
- 申请人: 西南交通大学
- 申请人地址: 四川省成都市二环路北一段
- 专利权人: 西南交通大学
- 当前专利权人: 西南交通大学
- 当前专利权人地址: 四川省成都市二环路北一段
- 代理机构: 杭州华进联浙知识产权代理有限公司
- 代理人: 戴贤群
- 主分类号: G06N3/092
- IPC分类号: G06N3/092 ; G06F9/50
摘要:
本申请涉及一种基于课程学习的多智能体深度强化学习方法和装置。所述方法包括:基于作用半径,确定初始多智能体深度强化学习模型的环境;在初始多智能体深度强化学习模型的环境中,完成一次多智能体深度强化学习模型的训练;重复上述过程,直到多智能体深度强化学习模型完成一个时间节点的训练;重复多智能体深度强化学习模型时间节点的训练过程,得到待评估模型;计算待评估模型与环境交互所得的奖励值,根据奖励值的计算结果,更新作用半径,重复此步骤,直到得到完备多智能体深度强化学习模型。采用本方法能够解决因为占用计算机资源多而导致计算机处理课程任务的效率低的问题。
公开/授权文献:
- CN116739077A 一种基于课程学习的多智能体深度强化学习方法和装置 公开/授权日:2023-09-12
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06N | 基于特定计算模型的计算机系统 |
------G06N3/00 | 基于生物学模型的计算机系统 |
--------G06N3/02 | .采用神经网络模型 |
----------G06N3/04 | ..体系结构,例如,互连拓扑 |
------------G06N3/092 | ...强化学习 |