Нейронные классификационные деревья разделяют скрытые подгруппы для надежного машинного обучения

Модели машинного обучения часто используют ложные корреляции, что приводит к высокой средней точности, но плохой производительности на недостаточно представленных подгруппах. Существующие стратегии смягчения обычно корректируют параметры сети с использованием аннотаций подгрупп или выведенных псевдометок. Однако эти методы, как правило, выдают только предсказание класса во время вывода (inference), не предоставляя информации о структуре скрытой подгруппы образца. Чтобы решить эту проблему, авторы предлагают Нейронные классификационные деревья (NCT) — фреймворк, который кодирует структуру подгрупп в своей древовидной архитектуре. NCT направляет каждый образец к легкому или сложному узлу на основе правильности предсказания и повторно использует эти маршруты в качестве псевдометок для последующих итераций. Этот процесс разделяет конфликтующие подгруппы без необходимости явного надзора по подгруппам. Подход был оценен на пяти наборах данных, охватывающих бинарные и многоклассовые ложные корреляции. Эксперименты показывают, что изученная топология дерева изолирует меньшинственные подгруппы, обеспечивая высокую интерпретируемость и конкурентоспособную надежность по сравнению с современными методами.