日本放送協会
音声認識の新境地!複雑な言語の流れもスムーズに解析

日本放送協会
音声認識の新境地!複雑な言語の流れもスムーズに解析
本特許技術は、テキストデータから抽出されたn単語連鎖に含まれる単語の同義語を前記置換テーブル記憶部から読み出し、前記n単語連鎖における当該単語を当該同義語で置換することにより新たなn単語連鎖を生成します。また、置換前のn単語連鎖の出現頻度に基づいて、置換後のn単語連鎖の出現頻度を推定します。その上で、テキストデータから抽出されたn上単語連鎖の出現頻度、および前記頻度推定部によって推定された置換後のn単語連鎖の出現頻度を含んだ置換言語モデルを生成します。これにより、音声認識処理を効率的かつ精度高く行うことが可能になります。
つまりは、本特許技術は、音声認識処理における言語モデル生成装置とそのプログラムに関するもので、テキストデータから抽出された単語を同義語で置換し、新たな単語連鎖を生成し、それを用いて適応言語モデルを作成します。
AIによる特許活用案
おすすめ業界 ITデータ解析言語学
- 音声認識を用いた字幕生成
- 複雑な音声データの解析
- 音声認識AIの精度向上
テレビ放送などの番組制作において、本特許の技術を用いて音声認識処理を行うことで、自動的に字幕テキストを作成することが可能になります。このため、手作業による字幕作成や訂正の手間を大きく削減することができます。
多様な話題やジャンルを扱う情報番組などの音声データは、単語の出現頻度や組み合わせが複雑です。本特許の技術を用いることで、これらの複雑な音声データを効率的に解析し、より高精度な音声認識を実現することができます。
本特許の技術を音声認識AIに組み込むことで、AIの認識精度を向上させることが可能です。特に、日常会話や自然言語を含む音声データの認識精度が大幅に向上し、より実用的な音声認識AIの実現に寄与します。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2014-148223 |
発明の名称 | 言語モデル生成装置、およびそのプログラム、ならびに音声認識装置 |
出願人/権利者 | 日本放送協会 |
公開番号 | 特開2016-024325 |
登録番号 | 特許第0006485941号 |
- サブスク
- 譲渡
- ライセンス
準備中です