Todos os artigos — korshunov.ai

Todos os artigos Página 1 / 12

Roteiro de Controle de IA para Segurança de Sistemas Internos

Um Roteiro de Controle de IA foi introduzido para proteger sistemas internos, integrando salvaguardas tradicionais com capacidades de monitoramento em tempo real.

lab OpenAI News · há 10 d

GPT-5.5 Instant melhora as respostas de saúde do ChatGPT

O GPT-5.5 Instant melhora as respostas de saúde e bem-estar do ChatGPT por meio de raciocínio mais forte, melhor manejo de contexto, comunicação mais clara e avaliações informadas por médicos.

lab Google — The Keyword (AI) · há 10 d

Nova pesquisa mostra que AMIE iguala médicos no manejo de doenças

Um estudo publicado na Nature revela que o AMIE, um sistema de IA conversacional, tem desempenho equivalente ao de médicos de família no manejo de condições de saúde complexas.

lab Google DeepMind Blog · há 10 d

Governo do Reino Unido e Google DeepMind lançam protótipo de planejamento habitacional com IA

O governo do Reino Unido se associou ao Google DeepMind para desenvolver um protótipo baseado em IA, projetado para acelerar as decisões de planejamento habitacional. A iniciativa visa simplificar o processo de construção de casas, aproveitando a inteligência artificial para melhorar a eficiência da tomada de decisões.

lab OpenAI News · há 10 d

OpenAI lança controles de gastos e análise de uso para o ChatGPT Enterprise

A OpenAI introduziu novos controles de gastos e análise de uso para o ChatGPT Enterprise. Esses recursos ajudam as empresas a gerenciar custos e tomar decisões informadas à medida que expandem o uso de IA.

github llama.cpp · há 10 d

llama.cpp release b9747 adiciona rastreamento de carregamento de modelo em tempo real e novos binários para plataformas

A versão b9747 do llama.cpp introduz o rastreamento em tempo real do progresso de carregamento do modelo por meio de endpoints SSE. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler, suportando várias arquiteturas e tecnologias de aceleração como Vulkan, CUDA, OpenVINO e SYCL.

github llama.cpp · há 10 d

llama.cpp lança b9745 com suporte a MTP3 e binários multiplataforma

A versão b9745 do llama.cpp introduz suporte para Step3.5/3.7 flash MTP3, incluindo novas APIs para flags de deslocamento de camada e nextn. O lançamento fornece binários pré-compilados para macOS, Linux, Android, Windows e openEuler, com opções de aceleração via CPU, Vulkan, CUDA, OpenVINO e SYCL.

github llama.cpp · há 11 d

LLaMA.cpp Lança b9744: Novos Binários e Recursos

O LLaMA.cpp lança a versão b9744 com binários atualizados para macOS, Linux, Android, Windows e openEuler. O lançamento inclui suporte para múltiplas arquiteturas e aceleradores de hardware como Vulkan, CUDA, OpenVINO, SYCL e ROCm. Um pacote de interface do usuário também está disponível para acesso à interface.

github llama.cpp · há 11 d

Lançamento do llama.cpp b9742: Atualizado com stride preenchido para pesos SSM-conv

A versão b9742 do llama.cpp introduz stride preenchido para pesos SSM-conv, melhorando a eficiência nas operações de redes neurais. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e APIs, incluindo Vulkan, CUDA, OpenVINO e SYCL.

github llama.cpp · há 11 d

Lançamento b9743 do llama.cpp adiciona novos binários e suporte a GPU

A versão b9743 do llama.cpp introduz novos binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas. O lançamento inclui suporte para Vulkan, CUDA 12.4 e 13.3, OpenVINO, SYCL e ROCm, com UI atualizada e regras de espaçamento do parser melhoradas via alinhamento de esquema JSON para gramática.

lab Claude Code Releases · há 11 d

Dica de Bloqueio de Stream Atualizada na v2.1.185

A dica de bloqueio de stream agora exibe "Aguardando resposta da API · tentará novamente em …" e é ativada após 20 segundos de silêncio, substituindo a mensagem e o atraso anteriores.

github llama.cpp · há 11 d

Lançamento do llama.cpp b9741 Adiciona Novos Binários e Suporte

A versão b9741 do llama.cpp introduz novos binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas. O lançamento inclui suporte para Vulkan, CUDA 12.4 e 13.3, OpenVINO, SYCL e ROCm, com versões atualizadas para iOS e Ubuntu.

github llama.cpp · há 11 d

Correção para falhas aleatórias no test-args-parser no Windows

Um patch corrige falhas aleatórias no test-args-parser no Windows ao modificar a substituição de argv para ser aplicada apenas quando argc corresponder, evitando a sobrescrita de argumentos programáticos. Isso resolve uma asserção de fastfail no fluxo de trabalho do OpenVINO no Windows, preservando o tratamento UTF-8 para binários reais.

github llama.cpp · há 11 d

LLaMA.cpp Release b9739 Adiciona Suporte a OpenCL Adreno ARM64 no Windows

A versão b9739 do LLaMA.cpp adiciona suporte para Windows ARM64 usando OpenCL Adreno. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e APIs, incluindo Vulkan, CUDA, OpenVINO e SYCL.

github llama.cpp · há 11 d

llama.cpp lança b9738: corrige encaminhamento do cabeçalho de autenticação CORS e novos builds binários

A versão b9738 do llama.cpp corrige o proxy CORS para evitar o encaminhamento de cabeçalhos de autenticação. O lançamento inclui builds binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware, incluindo Vulkan, CUDA, OpenVINO e SYCL.

github llama.cpp · há 12 d

ggml otimiza AMX com achatamento de partição

O projeto ggml otimizou o desempenho do AMX achatando a partição sobre n_batch * M, garantindo que todos os threads participem da quantização. Essa mudança melhora a velocidade em até 1,47x em vários modelos e configurações de hardware nas plataformas de CPU e GPU, com resultados mostrando ganhos consistentes no tempo de inferência.

github llama.cpp · há 12 d

Correção do indexador DSA do GLM-5.2: tensores marcados como não obrigatórios

O indexador DSA do modelo GLM-5.2 estava sendo carregado incorretamente em todas as camadas, causando falhas devido à ausência de tensores. A atualização marca os tensores do indexador como TENSOR_NOT_REQUIRED, permitindo que camadas sem um indexador sejam carregadas como nullptr e habilitando a atenção MLA completa. O DeepSeek-V3.2, com indexação uniforme, não é afetado.

github llama.cpp · há 12 d

Interface web pré-compilada do Docker para s390x

Uma pull request foi submetida para adicionar uma interface web pré-compilada para a arquitetura s390x no Docker. A alteração está atualmente pendente de lançamento e ainda não foi publicada.

github llama.cpp · há 12 d

LLaMA.cpp lança b9732: Novos Binários e Atualizações

O LLaMA.cpp lançou a versão b9732 com binários atualizados para macOS, Linux, Android, Windows e openEuler. O lançamento inclui comunicação refatorada de filho para roteador, correções no tratamento de wakeup, atualização_status() melhorada e documentação. As novas compilações suportam Vulkan, ROCm, OpenVINO, SYCL e CUDA 12/13 em múltiplas arquiteturas.

github llama.cpp · há 12 d

ggml-webgpu adiciona alternâncias de adaptador F16 para Vulkan e NVIDIA

O projeto ggml-webgpu adicionou alternâncias de adaptador para suporte a precisão meia (F16) em GPUs Vulkan e NVIDIA. Esta atualização permite melhor desempenho em hardware compatível em várias plataformas, incluindo macOS, Linux, Android, Windows e openEuler, com builds específicas disponíveis para as arquiteturas ARM e x64.