Roteiro de Controle de IA para Segurança de Sistemas Internos
Um Roteiro de Controle de IA foi introduzido para proteger sistemas internos, integrando salvaguardas tradicionais com capacidades de monitoramento em tempo real.
Um Roteiro de Controle de IA foi introduzido para proteger sistemas internos, integrando salvaguardas tradicionais com capacidades de monitoramento em tempo real.
O GPT-5.5 Instant melhora as respostas de saúde e bem-estar do ChatGPT por meio de raciocínio mais forte, melhor manejo de contexto, comunicação mais clara e avaliações informadas por médicos.
O governo do Reino Unido se associou ao Google DeepMind para desenvolver um protótipo baseado em IA, projetado para acelerar as decisões de planejamento habitacional. A iniciativa visa simplificar o processo de construção de casas, aproveitando a inteligência artificial para melhorar a eficiência da tomada de decisões.
A OpenAI introduziu novos controles de gastos e análise de uso para o ChatGPT Enterprise. Esses recursos ajudam as empresas a gerenciar custos e tomar decisões informadas à medida que expandem o uso de IA.
A versão b9747 do llama.cpp introduz o rastreamento em tempo real do progresso de carregamento do modelo por meio de endpoints SSE. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler, suportando várias arquiteturas e tecnologias de aceleração como Vulkan, CUDA, OpenVINO e SYCL.
A versão b9745 do llama.cpp introduz suporte para Step3.5/3.7 flash MTP3, incluindo novas APIs para flags de deslocamento de camada e nextn. O lançamento fornece binários pré-compilados para macOS, Linux, Android, Windows e openEuler, com opções de aceleração via CPU, Vulkan, CUDA, OpenVINO e SYCL.
O LLaMA.cpp lança a versão b9744 com binários atualizados para macOS, Linux, Android, Windows e openEuler. O lançamento inclui suporte para múltiplas arquiteturas e aceleradores de hardware como Vulkan, CUDA, OpenVINO, SYCL e ROCm. Um pacote de interface do usuário também está disponível para acesso à interface.
A versão b9742 do llama.cpp introduz stride preenchido para pesos SSM-conv, melhorando a eficiência nas operações de redes neurais. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e APIs, incluindo Vulkan, CUDA, OpenVINO e SYCL.
A versão b9743 do llama.cpp introduz novos binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas. O lançamento inclui suporte para Vulkan, CUDA 12.4 e 13.3, OpenVINO, SYCL e ROCm, com UI atualizada e regras de espaçamento do parser melhoradas via alinhamento de esquema JSON para gramática.
A dica de bloqueio de stream agora exibe "Aguardando resposta da API · tentará novamente em …" e é ativada após 20 segundos de silêncio, substituindo a mensagem e o atraso anteriores.
A versão b9741 do llama.cpp introduz novos binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas. O lançamento inclui suporte para Vulkan, CUDA 12.4 e 13.3, OpenVINO, SYCL e ROCm, com versões atualizadas para iOS e Ubuntu.
Um patch corrige falhas aleatórias no test-args-parser no Windows ao modificar a substituição de argv para ser aplicada apenas quando argc corresponder, evitando a sobrescrita de argumentos programáticos. Isso resolve uma asserção de fastfail no fluxo de trabalho do OpenVINO no Windows, preservando o tratamento UTF-8 para binários reais.
A versão b9739 do LLaMA.cpp adiciona suporte para Windows ARM64 usando OpenCL Adreno. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e APIs, incluindo Vulkan, CUDA, OpenVINO e SYCL.
A versão b9738 do llama.cpp corrige o proxy CORS para evitar o encaminhamento de cabeçalhos de autenticação. O lançamento inclui builds binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware, incluindo Vulkan, CUDA, OpenVINO e SYCL.
O projeto ggml otimizou o desempenho do AMX achatando a partição sobre n_batch * M, garantindo que todos os threads participem da quantização. Essa mudança melhora a velocidade em até 1,47x em vários modelos e configurações de hardware nas plataformas de CPU e GPU, com resultados mostrando ganhos consistentes no tempo de inferência.
O indexador DSA do modelo GLM-5.2 estava sendo carregado incorretamente em todas as camadas, causando falhas devido à ausência de tensores. A atualização marca os tensores do indexador como TENSOR_NOT_REQUIRED, permitindo que camadas sem um indexador sejam carregadas como nullptr e habilitando a atenção MLA completa. O DeepSeek-V3.2, com indexação uniforme, não é afetado.
Uma pull request foi submetida para adicionar uma interface web pré-compilada para a arquitetura s390x no Docker. A alteração está atualmente pendente de lançamento e ainda não foi publicada.
A versão 0.0.15 do Rust foi lançada. Esta versão inicial faz parte da fase de desenvolvimento inicial do Rust e inclui recursos fundamentais para a linguagem.
O Open Interpreter lançou a versão 0.0.16. A atualização introduz novos recursos e melhorias em sua funcionalidade principal, aprimorando a interação do usuário e as capacidades de execução de tarefas.
O Open Interpreter lançou a versão 0.0.17. A atualização introduz novos recursos e melhorias em sua funcionalidade principal, aprimorando a interação do usuário e as capacidades de execução de tarefas.