Open weights
arxiv arXiv cs.AI · 1 д назад

Эмпирическое исследование квантования OpenPangu на NPUs Ascend

Управляемое исследование оценивает модели OpenPangu 1B и 7B на NPUs Huawei Ascend 910B1 с использованием методов квантования только весов и весов-активации. Результаты показывают, что квантование только весов на 8 бит является без потерь для обеих моделей, в то время как квантование на 4 бита является практическим для модели 7B, но вредным для модели 1B при выполнении задач по логике, математике и программированию. Методы экстремально низкой точности, такие как 2 бита и бинарные, не срабатывают, и W4A4 SmoothQuant приводит к неопределённому перплексити, что указывает на сложность экстремального сжатия на низких битах.

media r/LocalLLaMA · 1 д назад

Выпущен открытый исходный приложение Hugging Face для загрузки

Разработчик выпустил открытый исходный десктоп-приложение, которое загружает модели, датасеты и пространства Hugging Face локально. Приложение автоматически обнаруживает проблемы соединения и продолжает загрузку, работает без облачных сервисов и сбора данных о пользователе, и поддерживает macOS, Windows и Linux (оба x64 и arm64).

blog Simon Willison · 1 д назад

OPFS + Pyodide test harness для редактирования SQLite в браузере

Разработан тестовый инструмент для исследования использования OPFS (Origin Private File System) с Pyodide с целью включения редактирования постоянных файлов SQLite в браузере. Инструмент предназначен для проверки способности Datasette Lite изменять локальные базы данных SQLite напрямую в браузере на разных браузерах.

media Hugging Face Forums · 1 д назад

Информация о поставщике инференса устарела?

Страница Hugging Face для модели Llama 3.1 405B перечисляет Featherless AI как поставщика, но тестовый веб-компонент показывает 'Не удалось получить данные' и на сайте featherless.ai модель не указана как доступная. Аналогичная проблема отмечена для модели Baidu ERNIE-4.5-300B.

media r/LocalLLaMA · 1 д назад

7 китайских компаний поставляют чипы класса H100/H200, большинство из которых были запущены в течение последних 6 месяцев

По крайней мере семь китайских компаний уже поставляют ускорители AI класса H100/H200, при этом большинство из них стали публичными в течение последних шести месяцев. Университет Ву в одиночку поставил 812 000 чипов AI в прошлом году, что составляет 49% от внутреннего спроса Китая, и его Ascend 950, по сообщениям, ориентирован на производительность класса H200. Несколько из этих компаний основаны бывшими лидерами NVIDIA и AMD в области чипов GPU, включая MetaX, чья выручка выросла в три раза за три года, и Alibaba, которая запустила сервер с объемом VRAM в 1,5 ТБ для развертывания передовых моделей на месте.

media r/LocalLLaMA · 2 д назад

Сравнение Docling, Liteparse, MinerU и Unstructured для обработки документов на локальной инфраструктуре

Вуз, стремящийся к обработке документов на локальной инфраструктуре для академических процессов, должен использовать локальные парсеры из-за строгих политик управления данными, запрещающих использование облачных API. Пользователь оценивает Docling, Liteparse, MinerU и Unstructured, отмечая, что Docling отлично справляется с сложными разметками и имеет лицензию Apache 2.0, но работает медленнее; Liteparse обеспечивает хорошую производительность при обработке печатных документов с использованием Tesseract OCR; MinerU использует PaddleOCR и хорошо справляется с документами на французском языке, несмотря на более длительную настройку; Unstructured поддерживает множество форматов, включая DOCX и PPTX. Решение должно обеспечивать повторяющуюся и стабильную обработку эволюционирующих PDF-документов с минимальными изменениями форматирования.

github llama.cpp · 2 д назад

Обновления бэкенда Vulkan и новые версии бинарных файлов для llama.cpp

Релиз llama.cpp b9774 добавляет поддержку бэкенда Vulkan для операций SQR, SQRT, SIN, COS, CLAMP, LEAKY_RELU и NORM, с поддержкой непрерывных входных данных. В релизе представлены бинарные сборки для macOS, Linux, Android, Windows и openEuler на различных архитектурах и бэкендах, включая CUDA, OpenVINO, SYCL и ROCm.

github llama.cpp · 2 д назад

Релиз LLaMA.cpp b9775: новые бинарники и поддержка нескольких платформ

LLaMA.cpp выпустил версию b9775, в которой представлены бинарники для macOS, Linux, Android, Windows и openEuler на различных архитектурах. В релизе включены поддержка CPU, Vulkan, OpenVINO, SYCL и ROCm, обновленные версии CUDA (12.4 и 13.3) и доступность iOS XCFramework. Также предоставляется пакет интерфейса.

media r/LocalLLaMA · 2 д назад

Человеческая оценка показывает, что GLM-5.2 конкурирует с лучшими моделями

Человеческая оценка на лидерборде Design Arena показывает, что GLM-5.2 демонстрирует почти такое же качество, как Fable 5 в задачах разработки игр, занимая лишь одну ступень ниже. Модель, основанная на открытых весах и лицензии MIT, оценивается как равнозначная по возможностям лучшим доступным моделям Claude, что указывает на то, что стандартизированные бенчмарки могут уже не отражать реальную производительность.

arxiv arXiv cs.CL · 2 д назад

Koshur Pixel: Первый масштабный синтетический набор данных для распознавания текста на кашмирском языке

Koshur Pixel представляет синтетический набор данных для распознавания текста, содержащий 613 078 пар изображений и текста, сгенерированных на основе корпуса KS-PRET-5M с использованием SynthOCR-Gen. В наборе присутствуют более 25 стратегий усилений и охватывают разнообразные шрифты и масштабы текста, от слов до полных документов, что позволяет масштабируемо обучать системы распознавания текста на кашмирском языке.

github llama.cpp · 2 д назад

Исправление проверки результатов Vulkan и связи тестов в llama.cpp

llama.cpp теперь связывает ggml-cpu при включении GGML_VULKAN_CHECK_RESULTS или GGML_VULKAN_RUN_TESTS для устранения ошибок связи. Это исправление восстанавливает функциональность отладки для проверки результатов Vulkan и тестирования после разделения библиотеки ggml-cpu.

arxiv arXiv cs.CL · 2 д назад

Tmax: Простая рецептура RL для агентов-конечных

Tmax представляет наиболее сильную открытую рецептуру для агентов-конечных, достигая 27% на Terminal-Bench 2.0 с использованием только 9B параметров. Он использует новую классификацию данных для генерации более чем на 2,5 раза больше окончательных сред, что позволяет эффективно обучать с простой рецептурой, ориентированной только на результат. Данные, модели и код доступны на GitHub по адресу https://github.com/hamishivi/tmax.

arxiv arXiv cs.CL · 2 д назад

UnBias-Plus: Выявление, объяснение и переписывание предвзятости

UnBias-Plus — это открытый инструментарий, который позволяет проводить классификацию предвзятости на уровне сегментов, локализацию предвзятых фрагментов, переписывание нейтрального текста и рассуждение по принятию решений. Он предлагает несколько способов доступа, включая Python, командную строку, REST-интерфейс и веб-интерфейсы, при этом весь исходный код, модели, наборы данных и документация доступны в открытом доступе.

media r/LocalLLaMA · 2 д назад

Модель MiniMax M3 EAGLE3 GGUF теперь совместима с llama.cpp

Декодер MiniMax M3 EAGLE3 был преобразован в формат GGUF и теперь совместим с llama.cpp. Проверки на системе 2x3090, 128 ГБ с использованием UD-Q2_K_XL квантования показали, что производительность увеличилась с 2,3 до 5 токенов в секунду при использовании --fit и сохранении модели в VRAM.

media r/LocalLLaMA · 2 д назад

Закон ЕС о искусственном интеллекте требует водяных знаков текста, сгенерированного ИИ, с августа 2024 года

Закон ЕС о искусственном интеллекте требует, чтобы все системы искусственного интеллекта, генерирующие синтетический текст, включали водяные знаки, доступные для машинного чтения и обнаружения, используя устойчивые, взаимодействующие технические решения с двумя слоями. Это касается всех моделей ИИ, включая открытые, и распространяется на любые услуги, доступные гражданам ЕС, независимо от их местоположения. Несоблюдение требований может привести к штрафам в размере до 35 миллионов евро или доли годового дохода, при этом поставщики моделей ИИ, представляющих системную угрозу, подвергаются повышенной ответственности.

lab Hugging Face Blog · 2 д назад

Доставка huggingface_hub еженедельно с ИИ, открытыми инструментами и человеческим контролем

Hugging Face представляет huggingface_hub еженедельно, интегрируя ИИ-модели, открытые инструменты и процесс человеческого ревью для обеспечения качества и безопасности. Обновление подчеркивает прозрачность, вовлечение сообщества и ответственное развитие ИИ через постоянную проверку с участием человека.

arxiv arXiv cs.CL · 2 д назад

Разработка корпуса текстов на основе аудио-символьного распознавания для языков Фонгбе и Хауса

Пайплайны аудио-символьного распознавания расширяют ресурсы текстов для малоиспользуемых западноафриканских языков Фонгбе и Хауса. Тонкая настройка модели MMS-300M на языке Фонгбе достигает 9,48% WER с сохранением тонов, в то время как транскрипции на языке Хауса достигают 57,4/100 по оценке человека; оценка сегментов на языке Фонгбе составляет только 36,5/100, что указывает на необходимость постобработки или улучшения моделей. В исследовании выпущены отобранные данные, настроенные модели и транскрибированные корпусы в соответствии с этическими принципами.

arxiv arXiv cs.CL · 2 д назад

Метод направления на этапе тестирования устраняет конфликты временных фактов в языковых моделях

Исследователи выявили параметрические временные конфликты в языковых моделях, где устаревшие факты сохраняются в параметрах. Они вводят Метод временного притяжения (TAS), подход на этапе тестирования, который устраняет 29-57% таких конфликтов без переобучения, сохраняя точность 85-99% на запросах без конфликтов и превосходя базовую модель на трёх из четырёх моделей.

arxiv arXiv cs.CL · 2 д назад

Многоагентная система аудита для клинического психического здоровья

Многоагентная система аудита улучшает клиническую психическую диагностику, разделяя процесс мышления на стадии восприятия, извлечения, вывода и аудита. Оценка на датасете DAIC-WOZ показывает снижение ошибки прогнозирования тяжести депрессии по шкале PHQ-8 с 5,35 до 5,02 и обеспечивает интерпретируемую и проверяемую диагностическую логику.