国立研究開発法人情報通信研究機構
音声認識の進化:多言語対応の音声テキスト変換技術!

国立研究開発法人情報通信研究機構
音声認識の進化:多言語対応の音声テキスト変換技術!
本特許は、複数の言語の音声信号を受け取り、対応するテキストを出力する推論器に関するものである。この推論器は、学習済みのモデルから出力される表現が含まれ、その表現は対応するテキストに含まれる各文字の発音を特定する情報を含む。さらに、前記文字の発音を特定する情報は音韻構造を表現するユニバーサル特徴に基づいている。この推論器を計算機で実現するための推論プログラムも提供される。また、音声信号と対応するテキストを用意し、前記テキストに含まれる文字の特徴を示す表現を生成し、前記音声信号の音声特徴を示す入力シーケンスを前記推論器に入力して得られる推論結果との誤差に基づいて、前記推論器を規定するパラメータを最適化する学習方法も提供される。
つまりは、この特許は、音声信号を文字に変換し、それぞれの文字の発音や言語特性を学習する推論器と、その学習方法について述べています。
AIによる特許活用案
おすすめ業界 IT教育カスタマーサービス
- 多言語対応の音声認識システムの開発
- 利用者サポートの自動化
- 多言語対応の教育ツールの開発
この特許の技術は、多言語対応の音声認識システムの開発に活用できます。音声信号を文字に変換し、それぞれの文字の発音や言語特性を学習する推論器を用いて、高精度な音声認識を実現することが可能です。
顧客からの音声による問い合わせを自動的にテキストに変換し、それをもとに質問を理解し適切な応答を生成するシステムを開発することができます。これにより、24時間365日対応の自動化された顧客サービスを提供することが可能となります。
この特許の技術を活用して、音声をテキストに変換する多言語対応の教育ツールを開発することができます。外国語学習者が発音を練習する際に、その発音の正確さをチェックしフィードバックを提供する機能を実装することも可能です。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2019-163555 |
発明の名称 | 推論器、推論プログラムおよび学習方法 |
出願人/権利者 | 国立研究開発法人情報通信研究機構 |
公開番号 | 特開2021-043272 |
登録番号 | 特許第0007385900号 |
- サブスク
- 譲渡
- ライセンス
準備中です