
基本信息:
- 专利标题: 基于多模态智能体驱动的OTT视觉特征提取系统及方法
- 申请号:CN202511156485.8 申请日:2025-08-19
- 公开(公告)号:CN120676177A 公开(公告)日:2025-09-19
- 发明人: 崔峥 , 陈明月 , 姚康康
- 申请人: 杭州华数智屏信息技术有限公司
- 申请人地址: 浙江省杭州市余杭区五常街道爱橙街1号10幢2单元3层E320-1室
- 专利权人: 杭州华数智屏信息技术有限公司
- 当前专利权人: 杭州华数智屏信息技术有限公司
- 当前专利权人地址: 浙江省杭州市余杭区五常街道爱橙街1号10幢2单元3层E320-1室
- 代理机构: 南京苏博知识产权代理事务所(普通合伙)
- 代理人: 孙斌
- 主分类号: H04N21/2187
- IPC分类号: H04N21/2187 ; H04N21/234 ; H04N21/2343 ; H04N21/25 ; H04N21/431 ; H04N21/44 ; H04N21/466 ; H04N21/488 ; H04N21/81 ; H04N21/8352 ; G06V10/82 ; G06V10/80
摘要:
本发明涉及互联网电视服务技术领域,具体为基于多模态智能体驱动的OTT视觉特征提取系统及方法,包括:捕获设备的屏幕实时视频流;对目标广告图像及实时视频流进行处理,通过多模态视觉感知模型提取出双流异构视觉特征,包括全局内容感知特征和局部几何结构特征;执行分层匹配算法,利用全局内容感知特征进行计算筛选出候选帧,在候选帧内利用局部几何结构特征进行匹配建立包含所有匹配的初始关键点对应关系集合,对集合进行空间聚类分离出广告实例,通过几何变换计算获得实例的边界框;根据边界框,在原始视频帧上对目标广告所在区域进行高亮显示生成可视化监播结果。本发明通过多模态智能体驱动,实现OTT广告视觉特征提取与监播。
IPC结构图谱:
H | 电学 |
--H04 | 电通信技术 |
----H04N | 图像通信,例如电视 |
------H04N21/00 | 可选的内容分发,例如交互式电视,VOD |
--------H04N21/20 | .专门适用于内容分发的专用服务器,例如:VOD服务器;其操作 |
----------H04N21/21 | ..服务器零部件或者服务器架构 |
------------H04N21/218 | ...音频或者视频内容的来源,如本地磁盘阵列 |
--------------H04N21/2187 | ....实时伺服 |