会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 6. 发明申请
    • HYBRID VIDEO RECOGNITION SYSTEM BASED ON AUDIO AND SUBTITLE DATA
    • 基于音频和数据的混合视频识别系统
    • WO2014199357A1
    • 2014-12-18
    • PCT/IB2014/062218
    • 2014-06-13
    • ERICSSON TELEVISION INC.
    • PHILLIPS, ChrisHUBER, MichaelREYNOLDS, JenniferDASHER, Charles
    • H04N21/4402H04N21/436
    • H04N21/42203H04N21/233H04N21/23418H04N21/4398H04N21/6582H04N21/8455
    • A system (10, 50) a»d.method (20, 32, 85, 118) where a second screen app (15) on a user device (14, 52-54) "listens" to audio clues from a video playback unit (56) that is currently playing an. audio-visual content. The audio clues include background audio and human speech content The background audio is converted into Locality Sensitive Hashtag (LSH) values. The human speech content is converted into an array of text data, The LSH values are used by a server (12, 62) to find. a. ballpark estimate of where in the audio-visual content the captured background audio is from. This ballpark estimate identifies a specific video segment. The server then matches dialog text array with pre-stored subtitle information (for the identified video segment) to provide a more accurate estimate of the current play-through location within that video segment. A timer-based correction provides additional accuracy. The combination of LSH-based and subtitle-based searches provides fast and accurate estimates of an audio- visual program's play-through location.
    • 其中用户设备(14,52-54)上的第二屏幕应用(15)从视频播放中“听”到音频线索的系统(10,50)a d d方法(20,32,85,118) 目前正在播放的单位(56)。 视听内容。 音频线索包括背景音频和人类语音内容背景音频被转换为局部敏感哈希塔格(LSH)值。 人类语音内容被转换成文本数据的阵列。服务器(12,62)使用LSH值来查找。 一个。 在拍摄的背景音频来自于视听内容的位置的ballpark估计。 这个球场估计标识了一个特定的视频段。 然后,服务器将对话文本阵列与预先存储的字幕信息(对于所识别的视频段)进行匹配,以提供对该视频段内的当前播放位置的更准确的估计。 基于定时器的校正提供了额外的精度。 基于LSH和基于字幕的搜索的组合可以快速准确地估计视听节目的播放位置。