Roteiro de Controle de IA para Segurança de Sistemas Internos
Um Roteiro de Controle de IA foi introduzido para proteger sistemas internos, integrando salvaguardas tradicionais com capacidades de monitoramento em tempo real.
Um Roteiro de Controle de IA foi introduzido para proteger sistemas internos, integrando salvaguardas tradicionais com capacidades de monitoramento em tempo real.
O GPT-5.5 Instant melhora as respostas de saúde e bem-estar do ChatGPT por meio de raciocínio mais forte, melhor manejo de contexto, comunicação mais clara e avaliações informadas por médicos.
Um estudo publicado na Nature revela que o AMIE, um sistema de IA conversacional, tem desempenho equivalente ao de médicos de família no manejo de condições de saúde complexas.
O governo do Reino Unido se associou ao Google DeepMind para desenvolver um protótipo baseado em IA, projetado para acelerar as decisões de planejamento habitacional. A iniciativa visa simplificar o processo de construção de casas, aproveitando a inteligência artificial para melhorar a eficiência da tomada de decisões.
A OpenAI introduziu novos controles de gastos e análise de uso para o ChatGPT Enterprise. Esses recursos ajudam as empresas a gerenciar custos e tomar decisões informadas à medida que expandem o uso de IA.
A versão b9747 do llama.cpp introduz o rastreamento em tempo real do progresso de carregamento do modelo por meio de endpoints SSE. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler, suportando várias arquiteturas e tecnologias de aceleração como Vulkan, CUDA, OpenVINO e SYCL.
A versão b9745 do llama.cpp introduz suporte para Step3.5/3.7 flash MTP3, incluindo novas APIs para flags de deslocamento de camada e nextn. O lançamento fornece binários pré-compilados para macOS, Linux, Android, Windows e openEuler, com opções de aceleração via CPU, Vulkan, CUDA, OpenVINO e SYCL.
O LLaMA.cpp lança a versão b9744 com binários atualizados para macOS, Linux, Android, Windows e openEuler. O lançamento inclui suporte para múltiplas arquiteturas e aceleradores de hardware como Vulkan, CUDA, OpenVINO, SYCL e ROCm. Um pacote de interface do usuário também está disponível para acesso à interface.
A versão b9742 do llama.cpp introduz stride preenchido para pesos SSM-conv, melhorando a eficiência nas operações de redes neurais. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e APIs, incluindo Vulkan, CUDA, OpenVINO e SYCL.
A versão b9743 do llama.cpp introduz novos binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas. O lançamento inclui suporte para Vulkan, CUDA 12.4 e 13.3, OpenVINO, SYCL e ROCm, com UI atualizada e regras de espaçamento do parser melhoradas via alinhamento de esquema JSON para gramática.
A dica de bloqueio de stream agora exibe "Aguardando resposta da API · tentará novamente em …" e é ativada após 20 segundos de silêncio, substituindo a mensagem e o atraso anteriores.
A versão b9741 do llama.cpp introduz novos binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas. O lançamento inclui suporte para Vulkan, CUDA 12.4 e 13.3, OpenVINO, SYCL e ROCm, com versões atualizadas para iOS e Ubuntu.
Um patch corrige falhas aleatórias no test-args-parser no Windows ao modificar a substituição de argv para ser aplicada apenas quando argc corresponder, evitando a sobrescrita de argumentos programáticos. Isso resolve uma asserção de fastfail no fluxo de trabalho do OpenVINO no Windows, preservando o tratamento UTF-8 para binários reais.
A versão b9739 do LLaMA.cpp adiciona suporte para Windows ARM64 usando OpenCL Adreno. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e APIs, incluindo Vulkan, CUDA, OpenVINO e SYCL.
A versão b9738 do llama.cpp corrige o proxy CORS para evitar o encaminhamento de cabeçalhos de autenticação. O lançamento inclui builds binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware, incluindo Vulkan, CUDA, OpenVINO e SYCL.
O projeto ggml otimizou o desempenho do AMX achatando a partição sobre n_batch * M, garantindo que todos os threads participem da quantização. Essa mudança melhora a velocidade em até 1,47x em vários modelos e configurações de hardware nas plataformas de CPU e GPU, com resultados mostrando ganhos consistentes no tempo de inferência.
O indexador DSA do modelo GLM-5.2 estava sendo carregado incorretamente em todas as camadas, causando falhas devido à ausência de tensores. A atualização marca os tensores do indexador como TENSOR_NOT_REQUIRED, permitindo que camadas sem um indexador sejam carregadas como nullptr e habilitando a atenção MLA completa. O DeepSeek-V3.2, com indexação uniforme, não é afetado.
Uma pull request foi submetida para adicionar uma interface web pré-compilada para a arquitetura s390x no Docker. A alteração está atualmente pendente de lançamento e ainda não foi publicada.
O LLaMA.cpp lançou a versão b9732 com binários atualizados para macOS, Linux, Android, Windows e openEuler. O lançamento inclui comunicação refatorada de filho para roteador, correções no tratamento de wakeup, atualização_status() melhorada e documentação. As novas compilações suportam Vulkan, ROCm, OpenVINO, SYCL e CUDA 12/13 em múltiplas arquiteturas.
O projeto ggml-webgpu adicionou alternâncias de adaptador para suporte a precisão meia (F16) em GPUs Vulkan e NVIDIA. Esta atualização permite melhor desempenho em hardware compatível em várias plataformas, incluindo macOS, Linux, Android, Windows e openEuler, com builds específicas disponíveis para as arquiteturas ARM e x64.