日本放送協会
音声認識の精度を飛躍的に向上させる、発音系列拡張装置

登録情報の修正申請

日本放送協会
音声認識の精度を飛躍的に向上させる、発音系列拡張装置

登録情報の修正申請

本装置は、発音系列の拡張を行う手段として、統計的機械翻訳モデル生成手段と単一音素言語モデル生成手段を備えています。これにより、標準音素列と実発話音素列が対訳である確率をフレーズ翻訳モデルとして生成します。さらに、実発話音素列の単一音素を1単語とした言語モデルである単一音素言語モデルも生成します。これらのモデルを用いて、見出し語の音素列に対して、フレーズ翻訳モデルと単一音素言語モデルとの同時確率が最大となる音素列を翻訳結果とします。これにより、発音辞書の見出し語や任意の文字列を発音系列に拡張可能にします。これにより、音声認識の精度が格段に改善されます。

つまりは、発音辞書の音素列を統計的機械翻訳モデルと単一音素言語モデルにより拡張し、音声認識の精度を改善する装置です。

AIによる特許活用案

音声認識技術の精度向上

本装置の利用により、音声認識技術の精度を向上させることが可能となります。特に、実際の発話とは異なる発音が表記上で記録されている場合や、発音が曖昧な場合でも、音声認識の精度を向上させることができます。

AI音声アシスタントの発音調整

AI音声アシスタントで利用される音声認識の精度を高め、もっと自然な会話を可能にすることができます。ユーザーの発音が標準的でない場合や、方言や訛りがある場合でも、本装置を利用することで、より正確にユーザーの発話を認識し、応答することができます。

音声翻訳サービスの精度向上

音声翻訳サービスに本装置を活用することで、音声認識の精度を向上させ、ユーザーが話した内容をより正確に翻訳することが可能となります。これにより、言葉の壁を越えて、スムーズなコミュニケーションを実現することができます。

活用条件

サブスク
譲渡
ライセンス

商品化・サービス化実証実験サンプル・プロトタイプ

特許評価書

権利概要

出願番号	特願2015-040346
発明の名称	発音系列拡張装置およびそのプログラム
出願人/権利者	日本放送協会
公開番号	特開2016-161765
登録番号	特許第0006475517号

サブスク
譲渡
ライセンス

準備中です

すべてのリスト一覧へ

知財活用のイノベーションで差別化を

知財活用のイノベーションで差別化を

日本放送協会
音声認識の精度を飛躍的に向上させる、発音系列拡張装置

日本放送協会
音声認識の精度を飛躍的に向上させる、発音系列拡張装置

AIによる特許活用案

活用条件

特許評価書

メールアドレス
パスワード

日本放送協会音声認識の精度を飛躍的に向上させる、発音系列拡張装置

日本放送協会音声認識の精度を飛躍的に向上させる、発音系列拡張装置

AIによる特許活用案

活用条件

特許評価書

日本放送協会
音声認識の精度を飛躍的に向上させる、発音系列拡張装置

日本放送協会
音声認識の精度を飛躍的に向上させる、発音系列拡張装置