日本放送協会
音声から情報を引き出す、音響イベント認識装置

日本放送協会
音声から情報を引き出す、音響イベント認識装置
本特許は音響イベント(笑い声や拍手、背景音楽など)を認識し、その言語表現を生成する装置やプログラムに関するものです。音声認識部が音声データから発話内容を抽出し、ニューラルネットワークが音響特徴量と言語特徴量から音響イベントの言語表現の事後確率を計算します。この技術は音声言語だけでなく非言語的な音声からも情報を引き出すため、放送番組の理解度を高めることが可能です。また、コンピュータプログラムによってこれらの機能を具現化し、音響イベント認識装置として機能させることができます。
つまりは、音声認識とニューラルネットワークを利用して音響イベントを高精度に認識し、その言語表現を生成する技術。
AIによる特許活用案
おすすめ業界 放送業界情報技術業界医療業界
- リアルタイム音響イベント認識システム
- 高齢者や聴覚障害者のための情報補償装置
- 音声データ解析システム
放送業界では、生放送番組の字幕制作などで音声認識が活用されていますが、本技術を応用することで非言語的な音声からも重要な情報を引き出し、視聴者の理解度を一層高めることが可能です。
本技術を活用し、音響イベントから字幕等の言語表現を生成することで、高齢者や聴覚障害者への情報補償を更に向上させることができます。音響イベントは視聴者が番組を理解する際に欠かせない要素であり、これらを文字情報として提供することは重要です。
情報技術業界では、大量の音声データから有益な情報を抽出するためのシステムとして本技術を活用することができます。ニューラルネットワークを用いて音響特徴量と言語特徴量を抽出し、音響イベントの言語表現を生成することで、音声データからより多くの情報を引き出すことが可能となります。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2014-094693 |
発明の名称 | 音響イベント認識装置、及びプログラム |
出願人/権利者 | 日本放送協会 |
公開番号 | 特開2015-212731 |
登録番号 | 特許第0006323947号 |
- サブスク
- 譲渡
- ライセンス
準備中です