日本放送協会
話題に特化した音声認識の革新 - グローバルと特定トピックの言語モデルを線形和補間

日本放送協会
話題に特化した音声認識の革新 - グローバルと特定トピックの言語モデルを線形和補間
本特許は、音声認識の精度を高めるための革新的な手法を提供します。大規模な学習データから予め学習したグローバル言語モデルと、音声認識対象の話題に関連する小規模な学習データから予め学習した話題依存言語モデルを線形和補間して混合言語モデルを生成します。評価用文章を用いてグローバル言語モデルを評価し、その結果を基に混合重みを生成します。さらに、全体評価値と個別評価値の間で評価重みを調整することで、音声認識の精度を大幅に向上させます。この装置とプログラムは、音声認識技術の精度向上に大きく寄与する可能性があります。
つまりは、音声認識の精度を高めるために、グローバル言語モデルと話題依存言語モデルを線形和補間して混合言語モデルを生成する装置とプログラム
AIによる特許活用案
おすすめ業界 IT人工知能音声認識
- 音声認識ソフトウェアの精度向上
- カスタマーサービスの自動化
- スマートホームデバイスの進化
この装置とプログラムを使って、音声認識ソフトウェアの精度を高めることができます。特に、特定の話題に基づく音声認識において優れた結果を提供します。
音声認識の精度が向上すれば、カスタマーサービスの自動化がより現実的になります。この装置とプログラムを利用して、顧客からの音声入力に対する応答精度を高め、より効率的なサービスを提供できます。
この技術をスマートホームデバイスに組み込むことで、デバイスがユーザーの音声コマンドをより正確に理解し、適切なアクションを実行する能力を向上させることができます。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2015-122789 |
発明の名称 | 言語モデル生成装置およびそのプログラム |
出願人/権利者 | 日本放送協会 |
公開番号 | 特開2017-009691 |
登録番号 | 特許第0006518142号 |
- サブスク
- 譲渡
- ライセンス
準備中です