【国立研究開発法人情報通信研究機構】タグ情報を保持する高精度機械翻訳システム
【国立研究開発法人情報通信研究機構】
タグ情報を保持する高精度機械翻訳システム
ークアップ言語用タグを含む原文を、高精度に機械翻訳する革新的なシステム。大量のタグ付き対訳データを準備することなく、タグ情報を保持しながら正確な翻訳を実現します。
本発明は、タグ付きの対訳文を大量に準備することなく、翻訳対象の原文に含まれるマークアップ言語用タグの情報を保持しつつ、高精度に機械翻訳するシステムに関するものです。従来の機械翻訳システムでは、タグ付きデータの準備が翻訳精度に大きく影響し、多量の対訳データが必要とされていました。
この機械翻訳処理システムは、以下の主要なコンポーネントで構成されています:
- 訓練用データ生成装置:訓練用データ生成処理を行い、タグを含まない対訳データから開始終了対応符号を検出し、それを代替符号に置換することで、マークアップ言語用タグを挿入された対訳データと同等のデータを生成します。
- 機械翻訳処理装置:生成された対訳データを用いて、機械翻訳モデルの学習を行い、タグ情報を保持しながら高精度な翻訳を実現します。
この方法により、対訳データの準備負担を大幅に軽減し、効率的に大量の訓練データを生成することが可能となります。結果として、マークアップ言語用タグを含む原文の翻訳においても、高い精度と品質を保つことができます。
この技術は、特にウェブコンテンツや技術文書の翻訳において有用です。ウェブページやマニュアルなど、タグ情報を保持したまま正確な翻訳が求められる場面で、効率的かつ効果的な翻訳を提供します。
AIによる特許活用案
おすすめウェブ開発技術文書翻訳コンテンツ管理
- ウェブコンテンツの多言語翻訳
- 技術文書の翻訳
- ローカリゼーションサービス
ウェブページやオンラインショップのコンテンツを、タグ情報を保持したまま高精度に翻訳し、グローバルなユーザーに対応します。
製品マニュアルや技術仕様書など、タグ付き文書の正確な翻訳を行い、国際展開をサポートします。
ソフトウェアやアプリケーションのローカリゼーションにおいて、タグ情報を保持しながら高品質な翻訳を提供し、ユーザーエクスペリエンスを向上させます。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2022-097221 |
出願日 | 2022/06/16 |
発明の名称 | 機械翻訳用訓練データ生成方法、機械翻訳処理用の学習可能モデルの作成方法、機械翻訳処理方法、および、機械翻訳用訓練データ生成装置 |
出願人/権利者 | 国立研究開発法人情報通信研究機構 |
公開番号 | 特開2023-183 |
特許取得国: JP
- サブスク
- 譲渡
- ライセンス
準備中です
#弁理士コメント
この特許は、タグ情報を保持しながら高精度な機械翻訳を実現するための革新的な方法を提供しています。対訳データの準備負担を軽減しつつ、高品質な翻訳を可能にする点が非常に優れています。