Тестирование Qwen3.6-35B-A3B на RTX 3060 для извлечения данных чеков в JSON

Пользователь заменил Google Vision в конвейере обработки чеков локальной моделью Qwen3.6-35B-A3B, работающей на GPU RTX 3060. Эксперимент показал, что локальная конфигурация успешно парсит ключевые поля из японских чеков в формат JSON.

Оборудование: RTX 3060 с 12 ГБ видеопамяти, используется llama.cpp и квантование GGUF Qwen3.6-35B-A3B с целевым размером 12 ГБ.
Точность: Стабильное извлечение полей магазина, даты, промежуточной суммы, налога и итоговой суммы примерно для 30 японских чеков.
Производительность: Среднее время обработки ~31.75 секунды на чек при пиковом использовании видеопамяти ~11.06 ГиБ.

Этот подход предлагает жизнеспособную локальную альтернативу облачным OCR-сервисам для задач извлечения документов без необходимости внешних API-зависимостей.