日本放送協会
画像から文章を生成する最先端のAI技術
          
日本放送協会
画像から文章を生成する最先端のAI技術
          本発明は、再帰型ニューラルネットワークを用いて学習した言語モデルを用いて、画像からキャプションを生成し、そのキャプションに基づいて次の単語を予測する単語推定装置に関するものです。具体的には、キャプション生成手段で生成された複数のキャプションをベクトル化して統合し、発話文の単語をベクトル化して言語モデルへの入力データを生成します。その後、入力単語ベクトルとキャプション統合ベクトルに基づいて、次の単語を推定します。この技術は、自然言語処理技術やAI技術を用いて、自然な文章を生成するためのツールとして広く利用される可能性があります。
つまりは、この特許は、画像から文章を生成し、その文章に基づいて次の単語を予測するための言語モデル学習装置およびそのプログラムに関するものです。
AIによる特許活用案
おすすめ業界 ITメディアエンターテイメント
- 自然言語生成ツールの開発
 - 自動字幕生成システムの開発
 - AIによるコンテンツ作成ツールの開発
 
この技術は、AIを用いて自然な文章を生成するツールの開発に活用できます。具体的には、画像やビデオを分析し、その内容を示すキャプションを生成し、さらにそのキャプションに基づいて次の単語を予測することで、自然な文章を生成することが可能です。
生放送番組や録画番組の字幕作成を自動化するためのシステムを開発することが可能です。画像や映像からキャプションを生成し、そのキャプションを基に次の単語を予測することで、リアルタイムで自然な字幕を生成することができます。
この技術を利用して、AIによるコンテンツ作成ツールを開発することも可能です。具体的には、画像やビデオを入力として、それに基づいた記事やブログ投稿を自動生成することができます。これにより、コンテンツ作成の手間を大幅に減らすことが可能となります。
活用条件
- サブスク
 - 譲渡
 - ライセンス
 
商品化・サービス化 | ASK 実証実験 | ASK サンプル・プロトタイプ | ASK
特許評価書
- 権利概要
 
| 出願番号 | 特願2018-115619 | 
| 発明の名称 | 言語モデル学習装置およびそのプログラム、ならびに、単語推定装置およびそのプログラム | 
| 出願人/権利者 | 日本放送協会 | 
| 公開番号 | 特開2019-219827 | 
| 登録番号 | 特許第0007101057号 | 
- サブスク
 - 譲渡
 - ライセンス
 
準備中です
