日本放送協会
音声認識の精度を飛躍的に向上させる、発音系列拡張装置

日本放送協会
音声認識の精度を飛躍的に向上させる、発音系列拡張装置
本装置は、発音系列の拡張を行う手段として、統計的機械翻訳モデル生成手段と単一音素言語モデル生成手段を備えています。これにより、標準音素列と実発話音素列が対訳である確率をフレーズ翻訳モデルとして生成します。さらに、実発話音素列の単一音素を1単語とした言語モデルである単一音素言語モデルも生成します。これらのモデルを用いて、見出し語の音素列に対して、フレーズ翻訳モデルと単一音素言語モデルとの同時確率が最大となる音素列を翻訳結果とします。これにより、発音辞書の見出し語や任意の文字列を発音系列に拡張可能にします。これにより、音声認識の精度が格段に改善されます。
つまりは、発音辞書の音素列を統計的機械翻訳モデルと単一音素言語モデルにより拡張し、音声認識の精度を改善する装置です。
AIによる特許活用案
おすすめ業界 IT音声認識サービスAI開発
- 音声認識技術の精度向上
- AI音声アシスタントの発音調整
- 音声翻訳サービスの精度向上
本装置の利用により、音声認識技術の精度を向上させることが可能となります。特に、実際の発話とは異なる発音が表記上で記録されている場合や、発音が曖昧な場合でも、音声認識の精度を向上させることができます。
AI音声アシスタントで利用される音声認識の精度を高め、もっと自然な会話を可能にすることができます。ユーザーの発音が標準的でない場合や、方言や訛りがある場合でも、本装置を利用することで、より正確にユーザーの発話を認識し、応答することができます。
音声翻訳サービスに本装置を活用することで、音声認識の精度を向上させ、ユーザーが話した内容をより正確に翻訳することが可能となります。これにより、言葉の壁を越えて、スムーズなコミュニケーションを実現することができます。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2015-040346 |
発明の名称 | 発音系列拡張装置およびそのプログラム |
出願人/権利者 | 日本放送協会 |
公開番号 | 特開2016-161765 |
登録番号 | 特許第0006475517号 |
- サブスク
- 譲渡
- ライセンス
準備中です