В статье представлены структурные сети Колмогорова-Арнольда (KAN), которые помещают обучаемые функции в структуру свёртки, а не в отдельные элементы ядра, организуя дизайн в зависимости от того, действует ли функция на значения пикселей или на форму фильтра. Представлены три реализации: SV-KAN с общей функцией значений, AG-KAN с гауссовским гейтом, адаптируемым к содержимому, и RF-KAN, который строит фильтры из ориентированных гребневых профилей в базисе вейвлетов Морле.

  • RF-KAN и SV-KAN достигают точности 88,47% и 88,20% на CIFAR-10 соответственно при примерно 0,4 млн параметров.
  • Эти модели превосходят обычные свёртки и KAN для отдельных рёбер при примерно одной пятой части параметров.
  • RF-KAN строит фильтры с использованием адаптируемых к содержимому амплитуд локализованных осциллирующих функций базиса вейвлетов.
  • Исследования аблиации выявляют, что обученная форма является критическим компонентом, её удаление приводит к падению точности более чем на сорок пунктов.

Авторы считают это значимым, поскольку это демонстрирует, что параметрически эффективные альтернативы KAN для отдельных рёбер могут достигать превосходной производительности за счёт использования адаптируемых к содержимому форм фильтров, а не только обучаемых активаций.