国立研究開発法人情報通信研究機構
高精度な音声合成技術を実現する特許

国立研究開発法人情報通信研究機構
高精度な音声合成技術を実現する特許
この特許は、音声合成のためのフロントエンドの学習方法について記述しています。具体的には、文字列から文字ベクトル列を生成するステップ、基本ユニットのパラメータを学習するステップ、DBRNN(Deep Bidirectional Recurrent Neural Network)を生成するステップなどが含まれます。また、DBRNNの出力を計算し、誤差逆伝播法によりパラメータを更新するステップも含まれています。さらに、これらのステップを所定の終了条件が成立するまで繰り返し実行することが記載されています。この特許の技術は、音声合成システムの精度向上に貢献します。
つまりは、音声合成のためのフロントエンドの学習方法に関する特許
AIによる特許活用案
おすすめ業界 IT音声認識AI開発
- パーソナルアシスタントの精度向上
- AI音声ガイドの開発
- 音声合成教育ツールの開発
この特許の技術を利用すれば、音声認識技術を用いたパーソナルアシスタントの精度を大幅に向上させることが可能です。特に、自然な音声合成が求められるアプリケーションにおいて有用です。
音声合成の精度を向上させることで、より自然な音声ガイドを提供するAIを開発することが可能です。観光地や博物館などでの利用を想定しています。
この特許の技術を活用して、音声合成の教育ツールを開発することも可能です。例えば、言語学習の一環として発音を模倣するためのツールや、発話訓練を必要とする人々を支援するツールなどが考えられます。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2018-147162 |
発明の名称 | 音声合成のためのフロントエンドの学習方法、コンピュータプログラム、音声合成システム、及び音声合成のためのフロントエンド処理方法 |
出願人/権利者 | 国立研究開発法人情報通信研究機構 |
公開番号 | 特開2019-032529 |
登録番号 | 特許第0007112075号 |
- サブスク
- 譲渡
- ライセンス
準備中です