国立研究開発法人情報通信研究機構
音声をクリアに聞き取る、耐雑音音声認識装置

国立研究開発法人情報通信研究機構
音声をクリアに聞き取る、耐雑音音声認識装置
この特許は、音響信号から特徴を抽出し、音声認識を行う装置に関するものです。特に雑音の多い環境でも音声認識の精度を保つことが可能です。装置は音響信号から特徴を抽出し、音声信号をテキスト化します。音声認識部は、音響信号から第1の特徴を抽出し、強調音声信号をフレーム化して第2の特徴を抽出します。さらに、音声認識に用いる音響モデルを記憶する手段も含まれ、このモデルは深層ニューラルネットワークで、サブネットワークを通じて音素を推定し出力します。このような特性により、音声認識の精度を高め、実用性を向上させることができます。
つまりは、高性能な音声認識装置で、雑音に耐え、発話内容をテキスト化します。
AIによる特許活用案
おすすめ業界 IT家電製品自動車業界
- スマートスピーカーへの応用
- 自動車業界への利用
- 家電製品への適用
この耐雑音音声認識装置は、音声認識の精度を高めるため、スマートスピーカーに応用可能です。雑音の多い環境でもコマンドを正確に認識し、ユーザーとより円滑にコミュニケーションを取ることができます。
車内は雑音が多く、音声認識が難しい環境です。この技術を車載システムに組み込むことで、運転中でも音声コマンドを正確に認識し、安全性を向上させることができます。
家電製品に音声認識機能を追加することで、ユーザビリティを向上させることができます。特に、高齢者や身体に障害を持つ人々が日常生活を送る上で、音声による操作は大きな助けとなります。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2018-133977 |
発明の名称 | 耐雑音音声認識装置及び方法、並びにコンピュータプログラム |
出願人/権利者 | 国立研究開発法人情報通信研究機構 |
公開番号 | 特開2020-012928 |
登録番号 | 特許第0007231181号 |
- サブスク
- 譲渡
- ライセンス
準備中です