Исследователи представили WBCMor VQA — клинически валидированный двуязычный бенчмарк для анализа лейкозов и нормальных белых кровяных телец на английском и урду. Этот ресурс устраняет пробел в многоязычных медицинских технологиях, особенно в таких регионах, как Пакистан, где клиническая документация часто не совпадает с языками общения пациентов. Датасет включает 110 000 двуязычных пар вопрос-ответ, аннотированных на основе 20 000 изображений отдельных клеток лейкозных и нормальных белых кровяных телец. Для обеспечения лингвистической согласованности и клинической корректности бенчмарк использует аннотации, учитывающие морфологию, из датасетов LeukemiaAttri и WBCAtt, а также специализированный словарь гематологии на языке урду. В исследовании также подчеркиваются ограничения существующих англоцентричных ресурсов для визуального языкового моделирования в разнообразных медицинских условиях. Базовые показатели производительности были установлены путем оценки нескольких открытых моделей визуального языкового моделирования на этом новом бенчмарке. Этот ресурс направлен на содействие разработке доступных систем искусственного интеллекта для многоязычных медицинских контекстов.
WBCMor VQA: Двуязычный англо-урду бенчмарк для визуального ответа на вопросы по гематологии
Переведено с English → Русский