知財活用のイノベーションで差別化を

知財活用のイノベーションで差別化を

富士通株式会社
音声の先端技術、発話者の方向と発話内容を素早く抽出

富士通株式会社
音声の先端技術、発話者の方向と発話内容を素早く抽出

本特許は、複数のマイクロフォンから収音された音声データを扱う音声処理技術に関するものである。音声データを複数のフレームに分割し、フレームごとに有意な音声が含まれるか否かを判定する。有意な音声が含まれるフレーム数に基づいて発話の検出を確定し、発話の開始位置を設定する。さらに、発話者の方向を特定し、その方向に基づいて音声データの発話区間を抽出する。発話内容の翻訳も含まれる。これにより、音声データの翻訳における語頭切れを防ぎ、より正確な音声認識と翻訳を実現する。

つまりは、複数の音声データから有意な発話を特定し、発話者の方向を識別し、音声データの発話内容を翻訳する音声処理方法、装置、およびプログラム

AIによる特許活用案

おすすめ業界 AI技術音声認識翻訳サービス

  • マルチリンガルなカスタマーサポートの強化
  • この技術をカスタマーサポートに活用することで、発話者の言語をリアルタイムで識別し、対応する言語のサポートスタッフに自動的に割り当てることが可能になります。これにより、顧客満足度の向上と効率的なリソース管理が実現します。

  • リアルタイム言語翻訳サービスの向上
  • この技術をリアルタイムの言語翻訳サービスに活用することで、より正確な音声認識と翻訳が可能になります。特に、複数の話者が存在する場面での音声認識の精度が向上します。

  • スマートホームデバイスの機能強化
  • スマートホームデバイスにこの技術を取り入れることで、デバイスが使用者の位置と話している言語を認識し、より適切な反応を返すことが可能になります。これにより、使用者の体験は大幅に向上します。

活用条件

  • サブスク
  • 譲渡
  • ライセンス

商品化・サービス化 実証実験 サンプル・プロトタイプ

特許評価書

特許評価書を閲覧する

  • 権利概要
出願番号特願2016-224568
発明の名称音声処理方法、音声処理装置、及び音声処理プログラム
出願人/権利者富士通株式会社
公開番号特開2018-081239
登録番号特許第0006737141号
  • サブスク
  • 譲渡
  • ライセンス

準備中です

特許文献ダウンロード

すべてのリスト一覧へ