国立大学法人九州工業大学
顔合成読唇装置及び顔合成読唇方法

国立大学法人九州工業大学
顔合成読唇装置及び顔合成読唇方法
本特許は、発話者の顔画像を加工することで読唇認識の精度を向上させる技術に関するものである(1頁要約参照)。本発明では、まず顔検出手段により学習用および認識用の顔画像を取得し、それらを特定の発話者の顔画像に変換する顔合成処理を行う。これにより、異なる人物の顔を統一的な基準顔に揃えることができる。その後、合成された顔画像から口唇領域を抽出し、特徴量を抽出して学習および認識に利用する。図2に示されるように、顔検出→顔合成→口唇抽出→特徴抽出という処理フローで構成される。顔の個人差を除去することで口の動きに集中でき、従来よりも高精度な読唇認識が可能となるAI画像処理技術である。
つまりは、“顔を揃える”と、口の動きが読みやすい。
AIによる特許活用案
おすすめ AI画像解析 顔認識 読唇
- 騒音環境での音声認識補助
音声が聞き取りにくい環境での補助認識技術。
- セキュリティ・監視
音声なしでも会話内容の推定に応用。
- アクセシビリティ支援
聴覚障害者向けのコミュニケーション支援。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 | ASK 実証実験 | ASK サンプル・プロトタイプ | ASK
- 権利概要
| 出願番号 | 特願2021-045840 |
| 発明の名称 | 顔合成読唇装置及び顔合成読唇方法 |
| 出願人/権利者 | 国立大学法人九州工業大学 |
| 公開番号 | 特開2022-144707 |
| 登録番号 | 特許第7624707号 |
- サブスク
- 譲渡
- ライセンス
準備中です
