YOMI-Bench：用于评估LLM日语汉字读音和音韵理解能力的基准测试

研究人员提出了 YOMI-Bench，这是一个旨在评估大型语言模型在日语中汉字读音和音韵理解能力的基准测试。该基准测试解决了由于每个字符有多种可能的读音而导致从表面文本推断正确读音的困难。

该研究强调，当前的 LLM 在处理日语汉字的语言特征方面存在困难，表明需要改进音韵理解能力。