Пользователь заменил Google Vision в конвейере обработки чеков локальной моделью Qwen3.6-35B-A3B, работающей на GPU RTX 3060. Эксперимент показал, что локальная конфигурация успешно парсит ключевые поля из японских чеков в формат JSON.

  • Оборудование: RTX 3060 с 12 ГБ видеопамяти, используется llama.cpp и квантование GGUF Qwen3.6-35B-A3B с целевым размером 12 ГБ.
  • Точность: Стабильное извлечение полей магазина, даты, промежуточной суммы, налога и итоговой суммы примерно для 30 японских чеков.
  • Производительность: Среднее время обработки ~31.75 секунды на чек при пиковом использовании видеопамяти ~11.06 ГиБ.

Этот подход предлагает жизнеспособную локальную альтернативу облачным OCR-сервисам для задач извлечения документов без необходимости внешних API-зависимостей.