日本放送協会
音声言語コーパス生成装置とそのプログラム:あなたの音声を理解するための革新的な技術

日本放送協会
音声言語コーパス生成装置とそのプログラム:あなたの音声を理解するための革新的な技術
この技術は音声認識による番組の字幕生成に対応するため、大規模な音声言語コーパスを構築する手法を提供します。音声言語コーパスは、さまざまなジャンルをカバーした大規模な音声データベースであり、音響モデルの学習に必要不可欠です。本発明の装置は、属性解析手段、ミスマッチ確率算出手段、誤り率算出手段、適否判定手段、音響モデル学習手段、音響モデル記憶手段、認識率算出手段、関値適応化手段を備えています。これらの機能により、生成された音響モデルを用いて音声を認識し、音声認識の精度を向上させることができます。また、この装置は特定の番組を特定のジャンル、番組名、または字幕制作方法により分類する機能も備えています。
つまりは、この特許は、音響モデルを学習するための音声言語コーパスを生成する装置とそのプログラムについて述べています。
AIによる特許活用案
おすすめ業界 放送業界音声認識技術AI技術
- リアルタイム字幕生成システムの改善
- 音声認識技術の精度向上
- 人工知能研究の進歩
この技術を用いることで、リアルタイムで番組の音声を認識し、精度の高い字幕を生成するシステムを改善することが可能になります。視聴者にとって理解しやすい番組体験を提供することができます。
大規模な音声言語コーパスを生成し、音響モデルを学習することで、音声認識技術の精度を向上させることが可能です。これにより、音声アシスタントや音声認識ソフトウェアの性能を向上させることができます。
この技術は、音声認識や自然言語処理などの人工知能研究において新たな進歩をもたらす可能性があります。大規模な音声データベースを活用することで、より高度なAIモデルの開発を促進することができます。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2016-031925 |
発明の名称 | 音声言語コーパス生成装置およびそのプログラム |
出願人/権利者 | 日本放送協会 |
公開番号 | 特開2017-045027 |
登録番号 | 特許第0006637332号 |
- サブスク
- 譲渡
- ライセンス
準備中です