国立研究開発法人情報通信研究機構
高度な音声認識システム

国立研究開発法人情報通信研究機構
高度な音声認識システム
本特許は、音声信号をフレームごとに解析し、対応するテキストを学習済モデルに入力して推定する音声認識システムに関するものです。第1のニューラルネットワークブロックは、音声信号からフレームごとに特徴ベクトルを生成し、この特徴ベクトルを第2のニューラルネットワークブロックに入力します。第2のニューラルネットワークブロックは、前記第1のニューラルネットワークブロックからのフレームごとの特徴ベクトルを受け取り、フレームごとに新たな特徴ベクトルを生成します。この新たな特徴ベクトルは、対応するテキストを推定する出力層に入力されます。それぞれのブロックは、全結合層と遅延操作層を含み、これらの層から出力される内部ベクトルは、重みを出力するニューラルネットワークに入力されます。
つまりは、音声信号をフレームごとに解析し、対応するテキストを推定する音声認識システム
AIによる特許活用案
おすすめ業界 IT通信サービス業
- 高度な音声認識機能を持つスマートホームデバイスの開発
- 音声認識を活用したカスタマーサポートシステムの構築
- ユーザーの発話を解析するスマートスピーカーの開発
本特許の技術を活用して、音声コマンドによる操作が可能なスマートホームデバイスを開発することが可能です。このデバイスは、家庭内の他のデバイスと連携して、音声による直感的な操作を可能にします。
本特許の音声認識技術を活用して、音声をテキストに自動変換し、顧客の問い合わせをリアルタイムで解析・応答するカスタマーサポートシステムを構築することができます。
本特許の技術を利用して、ユーザーの音声コマンドを解析し、必要な情報を提供するスマートスピーカーを開発することが可能です。これにより、ユーザーは音声だけで情報を得ることができ、手間を省くことができます。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2018-044491 |
発明の名称 | 音声認識システム、音声認識方法、学習済モデル |
出願人/権利者 | 国立研究開発法人情報通信研究機構 |
公開番号 | 特開2019-159058 |
登録番号 | 特許第0007109771号 |
- サブスク
- 譲渡
- ライセンス
準備中です