日本放送協会
音声認識の新次元、スペクトル分析による音声分離と認識

日本放送協会
音声認識の新次元、スペクトル分析による音声分離と認識
本特許は、混合音声から特定の発話を抽出し、認識する音声認識装置に関するものである。音素の特徴量に基づいて学習された音声モデルを用いて、混合音声と音素との間の確率を計算し、確率の最も高い最適パスを求める。その最適パス内に特定発話のパスが存在する場合、該当区間を特定発話区間候補とし、その音声信号を抽出する。さらに、特定発話区間候補の音声信号の特徴量に基づき、特定発話区間を検出する。この技術により、混合音声から特定の発話を高精度に分離・認識することが可能となる。
つまりは、各音素の特徴量に基づき学習し、混合音声から特定発話を抽出し、認識する音声認識装置の特許
AIによる特許活用案
おすすめ業界 IT音響技術人工知能
- 音声認識技術の向上
- スマートスピーカーへの応用
- 音声認識を用いたセキュリティシステム
この特許技術を用いることで、音声認識の精度を大幅に向上させることができる。特に、複数の音源が混ざり合った音声から特定の音声を抽出することが可能となるため、雑音が多い環境でも高精度な音声認識が可能となる。
スマートスピーカーに本特許を応用することで、ユーザーの声を周囲の雑音から効果的に分離し、より正確な音声認識と操作を可能にする。これにより、ユーザーエクスペリエンスが大幅に向上し、商品の評価も上がる可能性がある。
本特許技術を用いた音声認識を活用し、特定の人物の声を認識することで、個人認証の一環として使用することができる。これにより、音声認証によるセキュリティシステムの信頼性と精度を高めることができる。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2014-166016 |
発明の名称 | 音声認識装置及びプログラム |
出願人/権利者 | 日本放送協会 |
公開番号 | 特開2016-042152 |
登録番号 | 特許第0006487650号 |
- サブスク
- 譲渡
- ライセンス
準備中です