日本放送協会
映像識別の革新 - 音声から映像データを学習する映像識別器学習装置

日本放送協会
映像識別の革新 - 音声から映像データを学習する映像識別器学習装置
この映像識別器学習装置は、放送番組の音声信号と解説音声信号を比較し、解説音声信号を抽出します。この抽出した解説音声信号を音声認識し、その結果からラベルとなる単語を抽出します。抽出した単語と、その単語の発話時刻に対応した映像区間の番組映像データから抽出した特徴量を用いて、映像データが関連するか否かを検索する識別器を学習します。この技術は、映像識別と音声識別を組み合わせることで、より正確な映像識別を可能にします。また、音声認識部は音声認識に用いる音響モデルや言語モデルを適応化する能力も持っています。これにより、映像認識の精度をさらに向上させることが期待できます。
つまりは、本発明は、音声信号から映像識別器を学習することで、映像データをより正確に認識する装置とプログラムに関連しています。
AIによる特許活用案
おすすめ業界 テクノロジーメディアエンターテイメント
- 音声認識技術の改善
- アクセシビリティの向上
- AI技術の進化
本発明は、音声認識技術の改善に貢献します。音声から抽出した情報を用いて映像データを学習することで、映像認識の精度を向上させ、より正確な音声認識を実現することができます。
本発明は、視覚障害者や聴覚障害者にとってのアクセシビリティの向上に役立つ可能性があります。音声から映像データを学習し、映像中の物体やシーンを正確に認識することで、視覚障害者や聴覚障害者がテレビ番組や映像をより理解しやすくなる可能性があります。
本発明はAI技術の進化に寄与します。音声認識と映像認識の組み合わせは、AIの理解能力と応用可能性を広げ、新たなアプリケーションの開発を促進します。例えば、映像コンテンツの自動タグ付けや、ビデオゲームのAIキャラクターの行動予測などに応用することが可能です。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2014-131273 |
発明の名称 | 映像識別器学習装置、及びプログラム |
出願人/権利者 | 日本放送協会 |
公開番号 | 特開2016-009430 |
登録番号 | 特許第0006344849号 |
- サブスク
- 譲渡
- ライセンス
準備中です