国立研究開発法人情報通信研究機構
言語処理システム、言語処理方法および言語処理プログラム

国立研究開発法人情報通信研究機構
言語処理システム、言語処理方法および言語処理プログラム
本特許(JP 2022-123566 A)は、複数の読み方を持つ単語(多読み単語)を含むテキスト処理において、音声認識→機械翻訳→音声合成といった複数処理間で“正しい読み”を一貫して扱うための言語処理システムに関する発明です。従来は、音声認識で誤った読みを仮定したり、翻訳段階で読みの曖昧性が失われたり、音声合成で誤読が発生するといった問題がありました。
本発明の特徴は、多読み単語に対して読み方を識別する「識別情報」を生成し、その識別情報を各処理間で受け渡す点です。音声認識処理および機械翻訳処理は、出力テキストに多読み単語が含まれる場合、単語ごとの読みを特定する識別情報を付与して出力します(要約欄より)。一方、機械翻訳処理および音声合成処理は、入力テキストに識別情報が含まれる場合、その識別情報に基づき対応する単語の読み方を決定します。
PDFの図1には、音声認識→機械翻訳→音声合成が直列接続された構成が示され、各処理で識別情報が付与/参照される流れが分かります。
これにより、音声入力から多言語翻訳、音声出力までの一連の処理において、“同じ単語が別読みで処理されてしまう問題”を確実に回避でき、読み精度の高い翻訳・音声生成が可能となります。
つまりは、音声認識・機械翻訳・音声合成を横断して“正しい読み”を維持。複数読みを持つ単語でも誤訳や誤読を防ぐ、識別情報連携型の高精度言語処理技術です。
AIによる特許活用案
おすすめ音声認識機械翻訳音声合成
- 会議翻訳システムの精度向上
- 音声アシスタントの誤読防止
- 字幕生成・ナレーション自動制作
多読み固有名詞(例:橋本/はしもと・はしもと等)を識別情報で正確処理。
指示語や地名など読みが複数ある単語の読み間違いを大幅削減。
識別情報に基づく正しい読みを維持して自然な音声合成を実現。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 | ASK 実証実験 | ASK サンプル・プロトタイプ | ASK
特許評価書
- 権利概要
| 出願番号 | 特願2021-020952 |
| 発明の名称 | 言語処理システム、言語処理方法および言語処理プログラム |
| 出願人/権利者 | 国立研究開発法人情報通信研究機構 |
| 公開番号 | 特開2022-123566 |
| 登録番号 | 特許第7651161号 |
- サブスク
- 譲渡
- ライセンス
準備中です
