日本放送協会
音響モデルの新たな学習データ生成装置

日本放送協会
音響モデルの新たな学習データ生成装置
本発明は、音響モデルの適応化に必要な学習データを、準教師あり学習により生成する学習データ生成装置及びそのプログラムに関するものです。前記置換手段は、前記予め設定された単語数が5であることを特徴とし、音響モデルを適応化する音響モデル適応化手段を備えています。前記音響モデル適応化手段は、前記音響モデルを適応化した回数が予め設定された関値以下であるか否かを判定し、前記回数が前記関値以下の場合、適応化した前記音響モデルを前記音声認識手段に出力します。これにより、番組音声をリアルタイムで音声認識する手法を提供します。
つまりは、様々なジャンルの放送番組を高精度に音声認識するための学習データ生成装置。
AIによる特許活用案
おすすめ業界 IT放送業音声認識技術
- リアルタイム音声認識システムの開発
- 音声認識精度の向上
- 音声認識を利用したサービスの提供
本発明を利用して、放送番組の音声をリアルタイムで音声認識するシステムを開発することが可能です。これにより、放送内容をテキスト化し、より多くの人々が情報をアクセスできるようになります。
本発明の学習データ生成装置を活用すれば、音声認識の精度を向上させることができます。これにより、音声認識技術の適用範囲が広がり、多様な業界での利用が可能となります。
本発明を活用して、音声認識を利用した各種サービスを提供することが可能になります。例えば、音声認識を活用した自動翻訳サービスや、音声入力による操作が可能なサービスなど、さまざまな応用が考えられます。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2018-173443 |
発明の名称 | 学習データ生成装置及びそのプログラム |
出願人/権利者 | 日本放送協会 |
公開番号 | 特開2019-008315 |
登録番号 | 特許第0006578049号 |
- サブスク
- 譲渡
- ライセンス
準備中です