![一种基于记忆网络和卷积增强的视觉问答处理方法](/CN/2023/1/316/images/202311581604.jpg)
基本信息:
- 专利标题: 一种基于记忆网络和卷积增强的视觉问答处理方法
- 申请号:CN202311581604.5 申请日:2023-11-24
- 公开(公告)号:CN117668282A 公开(公告)日:2024-03-08
- 发明人: 刘倩 , 张萌萌 , 程春玲
- 申请人: 南京邮电大学
- 申请人地址: 江苏省南京市栖霞区文苑路9号
- 专利权人: 南京邮电大学
- 当前专利权人: 南京邮电大学
- 当前专利权人地址: 江苏省南京市栖霞区文苑路9号
- 代理机构: 南京经纬专利商标代理有限公司
- 代理人: 朱小兵
- 主分类号: G06F16/583
- IPC分类号: G06F16/583 ; G06F16/532 ; G06F16/9032 ; G06F18/2431 ; G06F18/25 ; G06V20/60 ; G06V10/42 ; G06V10/44 ; G06N3/0455 ; G06N3/0442 ; G06N3/0464
摘要:
本发明提供一种基于记忆网络和卷积增强的视觉问答处理方法,属于计算机视觉和自然语言处理领域结合的跨模态任务技术领域,通过记忆网络利用与图像相关的历史问题信息从全局角度生成图像的记忆补充特征,从而能够更加有效地利用同一张图像对应的历史问题中的互补信息,为模型提供更加全面和精确的历史记忆。其次应用卷积增强在问题引导的图像特征上进一步提取局部关键信息,随后与图像的记忆补充特征进行重加权融合,使模型在回答问题时更加关注与当前问题最相关的图像部分,从局部角度更精确的提取历史问题的互补信息,提高视觉问答模型的准确率。
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06F | 电数字数据处理 |
------G06F16/00 | 信息检索;数据库结构;文件系统结构 |
--------G06F16/10 | .文件系统;文件服务器 |
----------G06F16/58 | ..使用元数据的特征检索,例如,不来自内容或者元数据派生的 |
------------G06F16/583 | ...使用从内容中自动派生的元数据 |