国立研究開発法人情報通信研究機構
音声合成技術の新次元、統計的パラメトリック音声合成システム

国立研究開発法人情報通信研究機構
音声合成技術の新次元、統計的パラメトリック音声合成システム
本特許は、深層学習と統計モデルに基づいて音声を合成する新たなフレームワークを提供します。既知のテキストに対応する音声波形の基本周波数を抽出し、周期成分および非周期成分を単位区間毎に抽出します。その後、抽出された周期成分および非周期成分のスペクトル包絡を抽出し、既知のテキストの文脈情報に基づくコンテキストラベルを生成します。最後に、基本周波数、周期成分のスペクトル包絡、非周期成分のスペクトル包絡を含む音響特徴量と、対応するコンテキストラベルとを対応付けて学習することで、統計モデルを構築します。このフレームワークにより、高品質な音声を生成できるとともに、音声合成技術の進化に寄与します。
つまりは、統計的パラメトリック音声合成に従う音声合成技術の新たなフレームワークです。
AIによる特許活用案
おすすめ業界 IT教育エンターテイメント
- 高品質なテキスト読み上げサービスの開発
- AI音声アシスタントの開発
- 音声合成技術の研究開発
高品質な音声を生成できる本特許の技術を活用し、テキスト読み上げサービスの開発を行います。特に、教育分野や多言語翻訳サービスなどに応用可能です。
本特許の統計的パラメトリック音声合成技術を活用することで、より自然で理解しやすい音声を生成するAI音声アシスタントを開発できます。これにより、ユーザー体験が向上します。
音声合成技術の進化に寄与する本特許を研究開発に活用します。特に、深層学習や統計モデルに基づく音声合成の研究に役立ちます。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2017-037151 |
発明の名称 | 音声合成システム、音声合成プログラムおよび音声合成方法 |
出願人/権利者 | 国立研究開発法人情報通信研究機構 |
公開番号 | 特開2018-141915 |
登録番号 | 特許第0006802958号 |
- サブスク
- 譲渡
- ライセンス
準備中です