富士通株式会社
音声信号検出の新たな可能性!

富士通株式会社
音声信号検出の新たな可能性!
本発明は、音声信号から話者の発言部分を特定するための発話区間検出装置、その検出方法、及び実施するためのコンピュータプログラムを提供します。これは、音声信号の周期性の強さを示すピッチゲインを算出し、話者が発話していない非発話区間が継続している場合にピッチゲインが第1の閾値以上となると発話区間が開始されたと判定します。そして、発話区間が続いている場合にピッチゲインが第1の閾値より小さい第2の閾値未満となると発話区間が終了したと判定します。これにより、音声信号中で話者が発話している区間を正確に把握することが可能となります。
つまりは、本特許は、話者の音声を正確に把握するための発話区間検出装置、その方法及びプログラムを提供します。
AIによる特許活用案
おすすめ業界 IT音声認識技術コールセンター
- 音声認識システムの精度向上
- 音声アシスタントの改善
- 音声分析によるマーケティングリサーチ
本特許を活用することで、音声認識システムの精度を向上させることが可能です。特に、複数の話者が存在する状況や、ノイズが多い環境下での音声認識に有効です。
音声アシスタントが話者の発話をより正確に理解し、適切な応答を返す能力を向上させることができます。これにより、ユーザーエクスペリエンスの向上が期待できます。
顧客との通話内容から、発話区間を正確に把握し、その情報を元に音声分析を行うことで、より精度の高いマーケティングリサーチが可能となります。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2016-175765 |
発明の名称 | 発話区間検出装置、発話区間検出方法及び発話区間検出用コンピュータプログラム |
出願人/権利者 | 富士通株式会社 |
公開番号 | 特開2018-040982 |
登録番号 | 特許第0006759898号 |
- サブスク
- 譲渡
- ライセンス
準備中です