日本放送協会
音声認識の未来を切り開く、高精度言語モデル作成装置

日本放送協会
音声認識の未来を切り開く、高精度言語モデル作成装置
言語モデルは、音声認識や機械翻訳などで用いられ、入力された音声やテキストに対する最適な解釈を探索します。本発明は、言語要素列ごとの出現頻度情報を基にして、より精度の高い言語モデルを作成するための装置、およびその制御プログラムに関するものです。特に、学習テキストから出現頻度情報の基底を算出し、目的とする話題を表わす適応用テキストの出現頻度情報との類似度に基づく適応後出現頻度情報を生成。この適応後出現頻度情報から言語モデルを構築します。また、音声認識装置では、入力音声の音響特徴量を分析し、それに基づいて音声に対応する言語要素列の正解候補を探索し、その確度を算出します。これにより、音声認識の精度を大幅に向上させることが可能となります。
つまりは、本特許は、音声認識の精度を向上させるための言語モデル作成装置、音声認識装置、およびそれらを制御するプログラムに関するものです。
AIによる特許活用案
おすすめ業界 ITデータ分析通信
- 音声認識機能搭載AIアシスタントの開発
- 高精度機械翻訳システムの開発
- 自動音声文字起こしサービスの提供
本特許を用いて、音声認識機能を持つAIアシスタントを開発することが可能です。音声入力による操作を可能にし、ユーザーの手間を削減します。また、高精度な言語モデルにより、ユーザーの要望をより正確に理解し、満足度を向上させることができます。
本特許を活用して、高精度な機械翻訳システムを開発することができます。言語モデルを用いることで、より自然な翻訳結果を得ることが可能となります。また、学習テキストと適応用テキストを用いることで、特定の分野や話題に特化した翻訳も可能となります。
本特許の技術を用いて、自動で音声を文字に起こすサービスを提供することができます。音声認識の精度を向上させることで、ミーティングの議事録作成や講演の文字起こし等、幅広い用途で活用することが可能となります。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2012-048231 |
発明の名称 | 言語モデル作成装置、音声認識装置、およびそのプログラム |
出願人/権利者 | 日本放送協会 |
公開番号 | 特開2013-182260 |
登録番号 | 特許第0005914054号 |
- サブスク
- 譲渡
- ライセンス
準備中です