AKMessi lançou o Kivarro v0.1 alpha, uma bancada de inferência de modelos locais de código aberto construída com Rust e Tauri. A ferramenta é projetada para fornecer controle abrangente do tempo de execução para executar modelos GGUF localmente via llama.cpp.
- Os recursos incluem um registro de modelos GGUF, perfis de prompt (Equilibrado, extração JSON, revisão de código, contexto longo) e controles de ajuste em tempo de execução.
- Fornece uma interface de usuário estilo centro de comando com status da API local, logs, benchmarks e leituras de hardware/memória.
- A versão atual inclui uma compilação para Windows, enquanto o empacotamento para macOS e Linux ainda está em testes.
O autor está buscando feedback da comunidade r/LocalLLaMA para identificar recursos ou configurações ausentes que melhorariam a utilidade para fluxos de trabalho diários de modelos locais.