知財活用のイノベーションで差別化を

【国立研究開発法人情報通信研究機構】タグ情報を保持する高精度機械翻訳システム

タグも翻訳も正確に:新世代の機械翻訳技術

ークアップ言語用タグを含む原文を、高精度に機械翻訳する革新的なシステム。大量のタグ付き対訳データを準備することなく、タグ情報を保持しながら正確な翻訳を実現します。

特許内容の解説

本発明は、タグ付きの対訳文を大量に準備することなく、翻訳対象の原文に含まれるマークアップ言語用タグの情報を保持しつつ、高精度に機械翻訳するシステムに関するものです。従来の機械翻訳システムでは、タグ付きデータの準備が翻訳精度に大きく影響し、多量の対訳データが必要とされていました。

この機械翻訳処理システムは、以下の主要なコンポーネントで構成されています:

  1. 訓練用データ生成装置:訓練用データ生成処理を行い、タグを含まない対訳データから開始終了対応符号を検出し、それを代替符号に置換することで、マークアップ言語用タグを挿入された対訳データと同等のデータを生成します。
  2. 機械翻訳処理装置:生成された対訳データを用いて、機械翻訳モデルの学習を行い、タグ情報を保持しながら高精度な翻訳を実現します。

この方法により、対訳データの準備負担を大幅に軽減し、効率的に大量の訓練データを生成することが可能となります。結果として、マークアップ言語用タグを含む原文の翻訳においても、高い精度と品質を保つことができます。

この技術は、特にウェブコンテンツや技術文書の翻訳において有用です。ウェブページやマニュアルなど、タグ情報を保持したまま正確な翻訳が求められる場面で、効率的かつ効果的な翻訳を提供します。

AIによる特許活用案

おすすめウェブ開発技術文書翻訳コンテンツ管理

  • ウェブコンテンツの多言語翻訳
  • ウェブページやオンラインショップのコンテンツを、タグ情報を保持したまま高精度に翻訳し、グローバルなユーザーに対応します。

  • 技術文書の翻訳
  • 製品マニュアルや技術仕様書など、タグ付き文書の正確な翻訳を行い、国際展開をサポートします。

  • ローカリゼーションサービス
  • ソフトウェアやアプリケーションのローカリゼーションにおいて、タグ情報を保持しながら高品質な翻訳を提供し、ユーザーエクスペリエンスを向上させます。

  • 権利概要
出願番号特願2022-097221
出願日2022/06/16
発明の名称機械翻訳用訓練データ生成方法、機械翻訳処理用の学習可能モデルの作成方法、機械翻訳処理方法、および、機械翻訳用訓練データ生成装置
出願人/権利者国立研究開発法人情報通信研究機構
住所
公開番号特開2023-183

特許取得国:

  • サブスク
  • 譲渡
  • ライセンス

#弁理士コメント

この特許は、タグ情報を保持しながら高精度な機械翻訳を実現するための革新的な方法を提供しています。対訳データの準備負担を軽減しつつ、高品質な翻訳を可能にする点が非常に優れています。

準備中です