
基本信息:
- 专利标题: 基于深度强化学习网络构建对区域敏感的模型的方法
- 申请号:CN202111614735.X 申请日:2021-12-28
- 公开(公告)号:CN114004370A 公开(公告)日:2022-02-01
- 发明人: 黄凯奇 , 尹奇跃 , 张俊格 , 徐沛
- 申请人: 中国科学院自动化研究所
- 申请人地址: 北京市海淀区中关村东路95号
- 专利权人: 中国科学院自动化研究所
- 当前专利权人: 中国科学院自动化研究所
- 当前专利权人地址: 北京市海淀区中关村东路95号
- 代理机构: 北京华夏泰和知识产权代理有限公司
- 代理人: 李永叶
- 主分类号: G06N20/20
- IPC分类号: G06N20/20 ; G06K9/62 ; G06V10/764 ; G06V10/82
摘要:
本公开涉及一种基于深度强化学习网络构建对区域敏感的模型的方法,该方法包括:获取初始化状态下的智能体对图像仿真环境进行搜索的搜索数据;根据搜索数据,生成注意力图,并对注意力图进行离散化处理;将搜索数据中的位置状态信息和离散化处理后的注意力图输入至初始化的虚拟奖励模型中,输出得到虚拟奖励信息;根据虚拟奖励信息来更新搜索数据中的奖励信息,并对应更新智能体的搜索策略模型和更新虚拟奖励模型;根据更新后的搜索数据和虚拟奖励模型,对更新后的搜索策略模型继续进行训练,直至达到训练结束条件,训练完成的搜索策略模型为能够区分相似图像的图像搜索模型。该方法能够对相似图像针对性地采取不同的搜索策略。