RaDaR: специализированная LLM для рассуждений, ускоряющая диагностику редких заболеваний

Исследователи представляют RaDaR — открытую 32B параметр reasoning large language model, предназначенную для ускорения диагностики редких заболеваний за счет решения проблем клинической внедряемости и нехватки данных. Модель обучена на почти 50 000 публичных случаях и более чем 100 000 синтетических случаев, демонстрируя превосходные результаты по бенчмаркам и во внешних валидационных центрах.

RaDaR приоритизировала окончательный диагноз до задокументированного клинического подозрения в 61.06% ретроспективных случаев, обеспечивая потенциальное опережение на 1.87 месяца.
В рандомизированном испытании с помощью врачей RaDaR улучшила диагностическую точность на 21.44 процентных пункта по сравнению только с поиском в интернете.
Модель превзошла оцененные open-source модели, включая 671B DeepSeek-R1, по публичным бенчмаркам и четырем внешним валидационным центрам.
Аблиации на синтетических данных показывают, что фенотип-заякоренные нарративы обеспечивают полезный обучающий сигнал для редких заболеваний с длинным хвостом при монотонном тренде масштабирования.

RaDaR предоставляет внедряемую reasoning модель и воспроизводимую framework разработки для diagnostic AI, помогая преодолеть нехватку специализированного клинического опыта и обучающих данных в диагностике редких заболеваний.