基本信息:
- 专利标题: 視覚的質問応答モデル、電子機器、および記憶媒体
- 申请号:JP2020041593 申请日:2020-03-11
- 公开(公告)号:JP2020149685A 公开(公告)日:2020-09-17
- 发明人: ファン, ジャンフィ , キャオ, ミン , ファン, ピンピン , チュウ, ヨン , リュウ, ヤジュアン , リ, イン
- 申请人: ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド
- 申请人地址: 中華人民共和国 ペキン 100085, ハイディアン ディストリクト, シャンディ テンス ストリート, 10番, バイドゥ キャンパス 2階
- 专利权人: ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド
- 当前专利权人: ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド
- 当前专利权人地址: 中華人民共和国 ペキン 100085, ハイディアン ディストリクト, シャンディ テンス ストリート, 10番, バイドゥ キャンパス 2階
- 代理人: 上田 邦生; 柳 順一郎; 小栗 眞由美; 竹内 邦彦
- 优先权: CN201910185125.9 2019-03-12
- 主分类号: G06F40/30
- IPC分类号: G06F40/30 ; G06F40/216 ; G06F16/90
摘要:
【課題】画像情報とテキスト質問情報を組み合わせて視覚的質問応答を可能とする視覚的質問応答モデル、電子機器および記憶媒体を提供する。 【解決手段】視覚的質問応答モデルは、入力された質問テキストの単語ベクトルシーケンスをプーリング処理して、質問テキストのセマンティック表現ベクトルを抽出するためのテキストエンコーダと、セマンティック表現ベクトルと組み合わせて所定画像の画像特徴を抽出するための画像エンコーダと、を備える。 【選択図】図1