
基本信息:
- 专利标题: 一种融合卷积和稀疏视觉Transformer的高效特征学习方法与系统
- 申请号:CN202510482870.5 申请日:2025-04-17
- 公开(公告)号:CN120337996A 公开(公告)日:2025-07-18
- 发明人: 郭庆北 , 段泓冰 , 何升立 , 张文鑫
- 申请人: 济南大学
- 申请人地址: 山东省济南市南辛庄西路336号
- 专利权人: 济南大学
- 当前专利权人: 济南大学
- 当前专利权人地址: 山东省济南市南辛庄西路336号
- 主分类号: G06N3/0455
- IPC分类号: G06N3/0455 ; G06N3/0464 ; G06V10/764 ; G06V10/82
摘要:
本发明提出了一种融合卷积和稀疏视觉Transformer的高效特征学习方法与系统,涉及计算机视觉领域。本发明设计卷积与稀疏自注意力融合模块(CATB)作为神经网络CATFormer的主要构建块,在图像处理任务中根据特征图的空间位置进行均匀采样并进行交互,实现自注意机制的稀疏化,在降低自注意力的计算复杂度的同时,实现神经网络捕获图像的全局信息,并利用卷积的扩散特性,有效传递全局信息,从而实现高效的特征学习;堆叠多个CATB模块构成了神经网络CATFormer,在CATB中设置采样步长实现稀疏采样,从而提取具有全局代表性的token,所得到的神经网络模型可用于图像分类、目标检测、实例分割和语义分割等视觉任务的主干。
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06N | 基于特定计算模型的计算机系统 |
------G06N3/00 | 基于生物学模型的计算机系统 |
--------G06N3/02 | .采用神经网络模型 |
----------G06N3/04 | ..体系结构,例如,互连拓扑 |
------------G06N3/044 | ...循环网络,例如:Hopfield网络 |
--------------G06N3/0455 | ....自动编码器网络;编码器-解码器网络 |