![基于深度强化学习的机械臂自主动态避障方法及系统](/CN/2022/1/306/images/202211534571.jpg)
基本信息:
- 专利标题: 基于深度强化学习的机械臂自主动态避障方法及系统
- 申请号:CN202211534571.4 申请日:2022-11-29
- 公开(公告)号:CN116100539A 公开(公告)日:2023-05-12
- 发明人: 唐旭明 , 郑立 , 单晓锋 , 郭祥 , 韩先国 , 甄武东 , 董二宝 , 王亚豪
- 申请人: 国网安徽省电力有限公司淮南供电公司 , 中国科学技术大学
- 申请人地址: 安徽省淮南市田家庵区淮舜南路139号;
- 专利权人: 国网安徽省电力有限公司淮南供电公司,中国科学技术大学
- 当前专利权人: 国网安徽省电力有限公司淮南供电公司,中国科学技术大学
- 当前专利权人地址: 安徽省淮南市田家庵区淮舜南路139号;
- 代理机构: 北京润平知识产权代理有限公司
- 代理人: 刘兵
- 主分类号: B25J9/16
- IPC分类号: B25J9/16
摘要:
本发明实施例提供一种基于深度强化学习的机械臂自主动态避障方法及系统,属于自动化及机器人技术领域。所述机械臂自主动态避障方法包括:初始化当前的环境参数和经验回放池;选择当前需要执行的动作;将选择的动作发送至服务器端,以完成机械臂状态的更新;依据更新后的机械臂状态,更新奖励函数值;将执行动作前的状态、选取的动作、执行动作后的状态以及奖励值存储至经验回放池中;判断经验回放池内的数据量是否达到最小采样数;采用经验回放池训练深度学习网络,并确定深度学习网络的避障准确率;判断本轮迭代中的避障准确率与上一轮迭代中的避障准确率的差值是否大于预设值;在判断小于预设值的情况下,输出深度学习网络。
IPC结构图谱:
B | 作业;运输 |
--B25 | 手动工具;轻便机动工具;手动器械的手柄;车间设备;机械手 |
----B25J | 机械手;装有操纵装置的容器 |
------B25J9/00 | 程序控制机械手 |
--------B25J9/16 | .程序控制 |