日本放送協会
ニューラルネットワークを活用した高精度な文字領域検出装置

日本放送協会
ニューラルネットワークを活用した高精度な文字領域検出装置
当該装置は、画像から特徴量を複数の畳み込み層を介して抽出し、特徴マップを生成する第1ネットワークと、特徴マップを1チャンネルに畳み込んで文字マップを生成する第2ネットワークを組み合わせたモデルを活用します。特徴マップと文字マップから単独文字のペアが同じ文字列に含まれるか否かを示すペア属性を算出し、同じ文字列に含まれる単独文字の領域を統合した文字領域を算出します。さらに、ペア属性推定モデルはグラフコンボリューションネットワークで構成され、単独文字のペアをノードとし、同一の単独文字を持つノード間をエッジで接続したグラフ構造を生成します。これにより、画像内の文字領域の高精度な検出が可能となります。
つまりは、画像内の単独文字の領域分布を示す学習済のニューラルネットワークモデルを用いた文字領域検出装置です。
AIによる特許活用案
おすすめ業界 ITデータ解析画像処理
- 高精度なOCRシステムの実現
- 文書の自動デジタル化
- 自動翻訳システムの強化
当該技術を活用することで、より高精度なOCR(光学的文字認識)システムを実現することが可能です。画像内の文字領域を高精度に検出し、それを元に文字認識を行うことで、誤認識の減少と読み取り精度の向上が期待できます。
文書の自動デジタル化にも活用可能です。紙の文書をスキャンし、その画像から文字領域を検出することで、手作業でのデータ入力を大幅に減らし、効率的なデジタル化を実現することができます。
画像内の文字領域を高精度に検出することで、画像からの自動翻訳システムの精度を向上させることができます。特に、多言語が混在する画像に対して、文字領域を正確に特定することは重要となります。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2019-209628 |
発明の名称 | 文字領域検出モデル学習装置およびそのプログラム、ならびに、文字領域検出装置およびそのプログラム |
出願人/権利者 | 日本放送協会 |
公開番号 | 特開2021-082056 |
登録番号 | 特許第0007373367号 |
- サブスク
- 譲渡
- ライセンス
準備中です