Os pesquisadores propõem o YOMI-Bench, uma avaliação projetada para medir as capacidades dos grandes modelos de linguagem (LLMs) para ler kanji e compreender a fonologia no japonês. A avaliação aborda a dificuldade de inferir leituras corretas a partir do texto superficial devido a múltiplas leituras possíveis por caractere.
- O YOMI-Bench consiste em quatro tarefas especificamente projetadas para avaliar o desempenho de leitura de kanji.
- A avaliação analisou um LLM aberto multilíngue, quatro LLMs abertos específicos para japonês e cinco LLMs comerciais.
- Os resultados mostram que mesmo os modelos específicos para japonês apresentam baixo desempenho na leitura de kanji.
- Modelos comerciais também têm desempenho ruim em tarefas de geração que exigem considerar as leituras do kanji.
O estudo destaca que os LLMs atuais têm dificuldade com as características linguísticas do kanji japonês, indicando a necessidade de melhorar a compreensão fonológica.