富士通株式会社
音声の先端技術、発話者の方向と発話内容を素早く抽出

富士通株式会社
音声の先端技術、発話者の方向と発話内容を素早く抽出
本特許は、複数のマイクロフォンから収音された音声データを扱う音声処理技術に関するものである。音声データを複数のフレームに分割し、フレームごとに有意な音声が含まれるか否かを判定する。有意な音声が含まれるフレーム数に基づいて発話の検出を確定し、発話の開始位置を設定する。さらに、発話者の方向を特定し、その方向に基づいて音声データの発話区間を抽出する。発話内容の翻訳も含まれる。これにより、音声データの翻訳における語頭切れを防ぎ、より正確な音声認識と翻訳を実現する。
つまりは、複数の音声データから有意な発話を特定し、発話者の方向を識別し、音声データの発話内容を翻訳する音声処理方法、装置、およびプログラム
AIによる特許活用案
おすすめ業界 AI技術音声認識翻訳サービス
- マルチリンガルなカスタマーサポートの強化
- リアルタイム言語翻訳サービスの向上
- スマートホームデバイスの機能強化
この技術をカスタマーサポートに活用することで、発話者の言語をリアルタイムで識別し、対応する言語のサポートスタッフに自動的に割り当てることが可能になります。これにより、顧客満足度の向上と効率的なリソース管理が実現します。
この技術をリアルタイムの言語翻訳サービスに活用することで、より正確な音声認識と翻訳が可能になります。特に、複数の話者が存在する場面での音声認識の精度が向上します。
スマートホームデバイスにこの技術を取り入れることで、デバイスが使用者の位置と話している言語を認識し、より適切な反応を返すことが可能になります。これにより、使用者の体験は大幅に向上します。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2016-224568 |
発明の名称 | 音声処理方法、音声処理装置、及び音声処理プログラム |
出願人/権利者 | 富士通株式会社 |
公開番号 | 特開2018-081239 |
登録番号 | 特許第0006737141号 |
- サブスク
- 譲渡
- ライセンス
準備中です