基本信息:
- 专利标题: 基于H264压缩域的快速视频分类方法、系统及装置
- 申请号:CN202011086957.4 申请日:2020-10-12
- 公开(公告)号:CN112235569A 公开(公告)日:2021-01-15
- 发明人: 李扬曦 , 缪亚男 , 王佩 , 胡卫明 , 李兵 , 刘雨帆 , 关俊洋
- 申请人: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
- 申请人地址: 北京市朝阳区裕民路甲3号
- 专利权人: 国家计算机网络与信息安全管理中心,中国科学院自动化研究所
- 当前专利权人: 国家计算机网络与信息安全管理中心,中国科学院自动化研究所
- 当前专利权人地址: 北京市朝阳区裕民路甲3号
- 代理机构: 北京市恒有知识产权代理事务所
- 代理人: 郭文浩; 尹文会
- 主分类号: H04N19/107
- IPC分类号: H04N19/107 ; H04N19/109 ; H04N19/11 ; H04N19/124 ; H04N19/139 ; H04N19/91 ; G06K9/00 ; G06K9/62 ; G06N3/04 ; G06N3/08 ; G06T7/207 ; G06T7/246
摘要:
本发明属于计算机视觉领域,具体涉及了一种基于H264压缩域的快速视频分类方法、系统及装置,旨在解决现有视频分类技术速度慢、模型复杂度高的问题。本发明包括:提取H264标准的视频的I帧、P帧和B帧数据;进行I帧的解码及P帧和B帧的熵解码,获得I帧图像及视频帧之间的运动矢量;分别构建高低时间分辨率模型,并通过时间尺度注意力模块建模不同时间分辨率的特征进行模型融合;基于I帧图像和帧之间的运动矢量,获取四个初步预测分类;进行四个初步预测分类的加权融合,获得最终的预测分类结果。本发明无需进行所有视频帧的全解码,模型参数量小,可以有效提高视频分类速度,并能很好地识别视频中快慢不同的运动信息,实用性更强。
公开/授权文献:
- CN112235569B 基于H264压缩域的快速视频分类方法、系统及装置 公开/授权日:2024-03-29
IPC结构图谱:
H | 电学 |
--H04 | 电通信技术 |
----H04N | 图像通信,例如电视 |
------H04N19/00 | 用于数字视频信号编码,解码,压缩或解压缩的方法或装置 |
--------H04N19/10 | .使用自适应编码 |
----------H04N19/102 | ..其特征在于由一个元素,参数或选择影响或通过自适应编码控制 |
------------H04N19/103 | ...编码或预测模式选择 |
--------------H04N19/107 | ....空间和时间之间的预测编码,例如画面刷新 |