日本放送協会
音声認識結果を瞬時に整形する、最先端の学習装置

日本放送協会
音声認識結果を瞬時に整形する、最先端の学習装置
この装置は、音声の認識結果と予め整形した文を学習素材として用い、ニューラルネットワークの文整形モデルを学習します。これにより、音声認識結果と整形文の間でマッチングを行い、対応する認識結果および整形文のペアを学習データとして生成します。さらに、生成された学習データに対する整形文の正解を学習用整形文として用い、文整形モデルを学習します。この学習データ生成手段は、発話区間ごとに認識結果と整形文との間でマッチングを行い、対応する認識結果および整形文のペアを生成し、その類似度を算出します。また、算出された類似度を予め定めた閾値と比較し、選定を行います。これにより、音声認識結果の整形が可能となります。
つまりは、この特許は、音声認識結果を整形するためのモデルを学習する装置とそのプログラムに関するものです。
AIによる特許活用案
おすすめ業界 ITテレコミュニケーションエンターテイメント
- 音声認識システムの改善
- カスタマーサポートの効率化
- 会議の書き起こしサービスの向上
この学習装置を音声認識システムに組み込むことで、より精度の高い認識結果の整形が可能となり、ユーザー体験を向上させることができます。
電話によるカスタマーサポートにこの技術を活用することで、音声認識の結果をリアルタイムで整形し、カスタマーサポートの効率化を図ることができます。
会議の音声を認識し、リアルタイムで整形することで、より正確で読みやすい会議記録を提供することが可能となります。これにより、書き起こしサービスの品質向上と効率化を実現します。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2018-156926 |
発明の名称 | 音声認識結果整形モデル学習装置およびそのプログラム |
出願人/権利者 | 日本放送協会 |
公開番号 | 特開2020-030367 |
登録番号 | 特許第0007190283号 |
- サブスク
- 譲渡
- ライセンス
準備中です