YOMI-Bench: 日本語におけるLLMの漢字読解および音韻理解を評価するためのベンチマーク

研究者らは、日本語における大規模言語モデルの漢字読解および音韻理解能力を評価するために設計されたベンチマークであるYOMI-Benchを提案する。このベンチマークは、1文字あたりに複数の読み方が存在するため、表面レベルのテキストから正しい読み方を推測するのが困難であるという課題に対処している。

本研究は、現在のLLMが日本語の漢字の言語的特徴に苦戦していることを浮き彫りにし、音韻理解の改善が必要であることを示唆している。