В статье представлены структурные сети Колмогорова-Арнольда (KAN), которые помещают обучаемые функции в структуру свёртки, а не в отдельные элементы ядра, организуя дизайн в зависимости от того, действует ли функция на значения пикселей или на форму фильтра. Представлены три реализации: SV-KAN с общей функцией значений, AG-KAN с гауссовским гейтом, адаптируемым к содержимому, и RF-KAN, который строит фильтры из ориентированных гребневых профилей в базисе вейвлетов Морле.
- RF-KAN и SV-KAN достигают точности 88,47% и 88,20% на CIFAR-10 соответственно при примерно 0,4 млн параметров.
- Эти модели превосходят обычные свёртки и KAN для отдельных рёбер при примерно одной пятой части параметров.
- RF-KAN строит фильтры с использованием адаптируемых к содержимому амплитуд локализованных осциллирующих функций базиса вейвлетов.
- Исследования аблиации выявляют, что обученная форма является критическим компонентом, её удаление приводит к падению точности более чем на сорок пунктов.
Авторы считают это значимым, поскольку это демонстрирует, что параметрически эффективные альтернативы KAN для отдельных рёбер могут достигать превосходной производительности за счёт использования адаптируемых к содержимому форм фильтров, а не только обучаемых активаций.