Todos os artigos — korshunov.ai

Todos os artigos Página 1 / 15

Roteiro de Controle de IA para Segurança de Sistemas Internos

Um Roteiro de Controle de IA foi introduzido para proteger sistemas internos, integrando salvaguardas tradicionais com capacidades de monitoramento em tempo real.

lab OpenAI News · há 11 d

GPT-5.5 Instant melhora as respostas de saúde do ChatGPT

O GPT-5.5 Instant melhora as respostas de saúde e bem-estar do ChatGPT por meio de raciocínio mais forte, melhor manejo de contexto, comunicação mais clara e avaliações informadas por médicos.

lab Google DeepMind Blog · há 11 d

Governo do Reino Unido e Google DeepMind lançam protótipo de planejamento habitacional com IA

O governo do Reino Unido se associou ao Google DeepMind para desenvolver um protótipo baseado em IA, projetado para acelerar as decisões de planejamento habitacional. A iniciativa visa simplificar o processo de construção de casas, aproveitando a inteligência artificial para melhorar a eficiência da tomada de decisões.

lab OpenAI News · há 11 d

OpenAI lança controles de gastos e análise de uso para o ChatGPT Enterprise

A OpenAI introduziu novos controles de gastos e análise de uso para o ChatGPT Enterprise. Esses recursos ajudam as empresas a gerenciar custos e tomar decisões informadas à medida que expandem o uso de IA.

github llama.cpp · há 11 d

llama.cpp release b9747 adiciona rastreamento de carregamento de modelo em tempo real e novos binários para plataformas

A versão b9747 do llama.cpp introduz o rastreamento em tempo real do progresso de carregamento do modelo por meio de endpoints SSE. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler, suportando várias arquiteturas e tecnologias de aceleração como Vulkan, CUDA, OpenVINO e SYCL.

github llama.cpp · há 11 d

llama.cpp lança b9745 com suporte a MTP3 e binários multiplataforma

A versão b9745 do llama.cpp introduz suporte para Step3.5/3.7 flash MTP3, incluindo novas APIs para flags de deslocamento de camada e nextn. O lançamento fornece binários pré-compilados para macOS, Linux, Android, Windows e openEuler, com opções de aceleração via CPU, Vulkan, CUDA, OpenVINO e SYCL.

github llama.cpp · há 11 d

LLaMA.cpp Lança b9744: Novos Binários e Recursos

O LLaMA.cpp lança a versão b9744 com binários atualizados para macOS, Linux, Android, Windows e openEuler. O lançamento inclui suporte para múltiplas arquiteturas e aceleradores de hardware como Vulkan, CUDA, OpenVINO, SYCL e ROCm. Um pacote de interface do usuário também está disponível para acesso à interface.

github llama.cpp · há 11 d

Lançamento do llama.cpp b9742: Atualizado com stride preenchido para pesos SSM-conv

A versão b9742 do llama.cpp introduz stride preenchido para pesos SSM-conv, melhorando a eficiência nas operações de redes neurais. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e APIs, incluindo Vulkan, CUDA, OpenVINO e SYCL.

github llama.cpp · há 11 d

Lançamento b9743 do llama.cpp adiciona novos binários e suporte a GPU

A versão b9743 do llama.cpp introduz novos binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas. O lançamento inclui suporte para Vulkan, CUDA 12.4 e 13.3, OpenVINO, SYCL e ROCm, com UI atualizada e regras de espaçamento do parser melhoradas via alinhamento de esquema JSON para gramática.

lab Claude Code Releases · há 11 d

Dica de Bloqueio de Stream Atualizada na v2.1.185

A dica de bloqueio de stream agora exibe "Aguardando resposta da API · tentará novamente em …" e é ativada após 20 segundos de silêncio, substituindo a mensagem e o atraso anteriores.

github llama.cpp · há 12 d

Lançamento do llama.cpp b9741 Adiciona Novos Binários e Suporte

A versão b9741 do llama.cpp introduz novos binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas. O lançamento inclui suporte para Vulkan, CUDA 12.4 e 13.3, OpenVINO, SYCL e ROCm, com versões atualizadas para iOS e Ubuntu.

github llama.cpp · há 12 d

Correção para falhas aleatórias no test-args-parser no Windows

Um patch corrige falhas aleatórias no test-args-parser no Windows ao modificar a substituição de argv para ser aplicada apenas quando argc corresponder, evitando a sobrescrita de argumentos programáticos. Isso resolve uma asserção de fastfail no fluxo de trabalho do OpenVINO no Windows, preservando o tratamento UTF-8 para binários reais.

github llama.cpp · há 12 d

LLaMA.cpp Release b9739 Adiciona Suporte a OpenCL Adreno ARM64 no Windows

A versão b9739 do LLaMA.cpp adiciona suporte para Windows ARM64 usando OpenCL Adreno. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e APIs, incluindo Vulkan, CUDA, OpenVINO e SYCL.

github llama.cpp · há 12 d

llama.cpp lança b9738: corrige encaminhamento do cabeçalho de autenticação CORS e novos builds binários

A versão b9738 do llama.cpp corrige o proxy CORS para evitar o encaminhamento de cabeçalhos de autenticação. O lançamento inclui builds binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware, incluindo Vulkan, CUDA, OpenVINO e SYCL.

github llama.cpp · há 12 d

ggml otimiza AMX com achatamento de partição

O projeto ggml otimizou o desempenho do AMX achatando a partição sobre n_batch * M, garantindo que todos os threads participem da quantização. Essa mudança melhora a velocidade em até 1,47x em vários modelos e configurações de hardware nas plataformas de CPU e GPU, com resultados mostrando ganhos consistentes no tempo de inferência.

github llama.cpp · há 12 d

Correção do indexador DSA do GLM-5.2: tensores marcados como não obrigatórios

O indexador DSA do modelo GLM-5.2 estava sendo carregado incorretamente em todas as camadas, causando falhas devido à ausência de tensores. A atualização marca os tensores do indexador como TENSOR_NOT_REQUIRED, permitindo que camadas sem um indexador sejam carregadas como nullptr e habilitando a atenção MLA completa. O DeepSeek-V3.2, com indexação uniforme, não é afetado.

github llama.cpp · há 12 d

Roteiro de Controle de IA para Segurança de Sistemas Internos

GPT-5.5 Instant melhora as respostas de saúde do ChatGPT

Governo do Reino Unido e Google DeepMind lançam protótipo de planejamento habitacional com IA

OpenAI lança controles de gastos e análise de uso para o ChatGPT Enterprise

llama.cpp release b9747 adiciona rastreamento de carregamento de modelo em tempo real e novos binários para plataformas

llama.cpp lança b9745 com suporte a MTP3 e binários multiplataforma

LLaMA.cpp Lança b9744: Novos Binários e Recursos

Lançamento do llama.cpp b9742: Atualizado com stride preenchido para pesos SSM-conv

Lançamento b9743 do llama.cpp adiciona novos binários e suporte a GPU

Dica de Bloqueio de Stream Atualizada na v2.1.185

Lançamento do llama.cpp b9741 Adiciona Novos Binários e Suporte

Correção para falhas aleatórias no test-args-parser no Windows

LLaMA.cpp Release b9739 Adiciona Suporte a OpenCL Adreno ARM64 no Windows

llama.cpp lança b9738: corrige encaminhamento do cabeçalho de autenticação CORS e novos builds binários

ggml otimiza AMX com achatamento de partição

Correção do indexador DSA do GLM-5.2: tensores marcados como não obrigatórios

Interface web pré-compilada do Docker para s390x

Lançamento do Rust 0.0.15

Open Interpreter 0.0.16 Lançado

Open Interpreter 0.0.17 Lançado