![一种面向多约束被控系统的在线强化学习方法及装置](/CN/2024/1/159/images/202410798671.jpg)
基本信息:
- 专利标题: 一种面向多约束被控系统的在线强化学习方法及装置
- 申请号:CN202410798671.0 申请日:2024-06-20
- 公开(公告)号:CN118674065A 公开(公告)日:2024-09-20
- 发明人: 贾庆山 , 江锐城 , 郭琦 , 黄立滨 , 余佳微 , 郭天宇 , 卢远宏 , 郭海平 , 涂亮
- 申请人: 清华大学 , 南方电网科学研究院有限责任公司
- 申请人地址: 北京市海淀区清华园
- 专利权人: 清华大学,南方电网科学研究院有限责任公司
- 当前专利权人: 清华大学,南方电网科学研究院有限责任公司
- 当前专利权人地址: 北京市海淀区清华园
- 代理机构: 北京三友知识产权代理有限公司
- 代理人: 许曼; 贾磊
- 主分类号: G06N20/00
- IPC分类号: G06N20/00 ; G06F17/18 ; G06Q10/067 ; G06Q10/0631 ; G06Q50/06
摘要:
本发明涉及强化学习领域,提供了一种面向多约束被控系统的在线强化学习方法及装置,方法包括:对动作集合中各动作按预设采样量采样,根据采样结果确定各动作的Q因子的方差、各动作激活约束条件的Q