v0.5.14
O artigo anuncia o lançamento da versão 0.5.14.
O artigo anuncia o lançamento da versão 0.5.14.
A versão 2.1.193 do Claude Code introduz várias melhorias na classificação do modo automático, registro de telemetria e gerenciamento de agentes em segundo plano. Esta atualização também inclui correções para problemas de estado da interface do usuário, manipulação de autenticação em servidores MCP e vários bugs relacionados ao funcionamento em segundo plano.
Este artigo descreve um método para automatizar a manutenção de forks de software usando agentes de codificação por IA, aplicando-o ao fork do vLLM pela Cohere. A abordagem reduz o tempo necessário para absorver lançamentos da ramificação principal de semanas para dias, substituindo a intervenção manual por um ciclo de feedback automatizado.
Pesquisadores desenvolveram o Teste Causal Generativo (GCT), uma estrutura que traduz modelos de previsão cerebral baseados em LLMs, não interpretáveis, em hipóteses verbais concisas e testáveis sobre a função cortical. Este método resume os parâmetros do modelo em frases curtas descrevendo a quais regiões específicas do cérebro elas respondem, como "preparação de alimentos", e então verifica essas explicações por meio de experimentos de fMRI direcionados.
O Google Finance está oficialmente encerrando sua fase beta e lançando um aplicativo dedicado para dispositivos Android.
Esta versão candidata corrige a funcionalidade de Prefill/Decode (P/D) em conjunto com o Supervisor de Paralelismo de Dados (DP) no projeto vLLM.
A Cohere desenvolveu um agente de segurança usando sua plataforma de IA corporativa, Cohere North, integrada à plataforma de segurança em nuvem Wiz por meio de um servidor Model Context Protocol (MCP) personalizado. Essa arquitetura conecta o North à API GraphQL da Wiz por meio de oito ferramentas atômicas, permitindo fluxos automatizados de resposta a incidentes a partir de um único prompt. O sistema realiza análise do raio de explosão de combinações tóxicas avaliando cadeias de ataque e classificando riscos com base na exposição à internet e nos níveis de privilégio em aproximadamente 20 segundos. Ele também automatiza a investigação de ponta a ponta, recuperando detalhes do problema, criando tickets no Linear, atualizando o status da Wiz e redigindo relatórios estruturados de Resposta a Incidentes. Além disso, uma automação semanal agendada gera um resumo da postura de segurança toda segunda-feira pela manhã sem intervenção manual. Essa integração elimina o ciclo de triagem anterior de 30 minutos a duas horas por achado, permitindo que os engenheiros se concentrem na avaliação das análises em vez de alertas brutos.
Um novo artigo de pesquisa da OpenAI demonstra como os agentes de inteligência artificial estão mudando fundamentalmente a natureza do trabalho. O estudo destaca a capacidade desses agentes de executar tarefas mais longas e complexas do que era possível anteriormente. Esse avanço tecnológico é creditado por expandir a produtividade em uma ampla variedade de funções profissionais. As descobertas sugerem uma mudança significativa na forma como o trabalho é organizado e realizado por meio da automação. Ao lidar com fluxos de trabalho intricados, os agentes de IA estão permitindo que os usuários alcancem maior eficiência. O artigo serve como evidência do crescente impacto dos sistemas autônomos no emprego moderno.
A versão 2.1.191 do Claude Code introduz suporte para /rewind, permitindo que os usuários retomem conversas a partir de antes da execução de um comando /clear. A atualização corrige vários problemas críticos, incluindo agentes em segundo plano sendo ressuscitados após serem interrompidos e pulos na posição de rolagem durante respostas em streaming. Também corrige o comportamento em que /voice exibia mensagens de erro genéricas e onde URLs de /login eram truncadas no Windows Terminal. Melhorias significativas aumentam a confiabilidade para servidores MCP, adicionando lógica de retry para erros de rede transitórios durante a descoberta de capacidades e fluxos OAuth. Ambientes headless agora pulam pop-ups do navegador para OAuth, enquanto permissões de rede da sandbox são lembradas pela duração da sessão. Otimizações de desempenho reduzem o uso de CPU durante o streaming em aproximadamente 37% por meio da coalescência de atualizações de texto e mitigam o crescimento de memória em sessões longas proveniente do cache de saída do terminal.
O Google introduziu o uso do computador no Gemini 3.5 Flash, permitindo que o modelo execute código e interaja com ferramentas externas. Este recurso permite que os usuários executem tarefas de programação e acessem informações em tempo real por meio de funções de computação integradas.
A versão 2.1.190 inclui correções de bugs e melhorias de confiabilidade. Nenhuma nova funcionalidade foi anunciada nesta atualização.
O Mistral Studio agora oferece controles administrativos aprimorados para gerenciar o acesso ao conector por workspace e ferramenta, permitindo permissões granulares. Os recursos incluem chaves de API com escopos, conectores multi-conta e um novo Conector Debugger para análise de causa raiz, tudo suportando integração segura e auditável com sistemas corporativos.
O Talos é uma ferramenta de código aberto que automatiza a reanálise iterativa de dados genômicos para identificar diagnósticos de doenças raras. Ele alcançou uma taxa de recuperação de 90% dos diagnósticos dentro do escopo, com apenas 1,3 variantes candidatas por paciente, e forneceu 241 novos diagnósticos em 5.000 pacientes sem diagnóstico, com a maioria das novas descobertas surgindo dentro de 32 dias da publicação das evidências.
A OpenAI e a Broadcom apresentaram o Jalapeño, um chip de IA personalizado projetado para inferência de modelos de linguagem grandes. O chip visa melhorar o desempenho, a eficiência e a escalabilidade em sistemas de IA.
vllm lança v0.24.0rc1, incluindo correção para problemas de compilação do histograma topk no SM75. A alteração foi cherry-picked do commit 191826e e aprovada por Mohammad Miadh Angkad.
O Claude v2.1.187 introduz bloqueio de credenciais em sandbox, restrições de modelo configuradas pela organização, suporte a cliques do mouse em tela cheia e correções para falhas de comando, travamentos de ferramentas e estabilidade da interface. As atualizações também melhoram o tratamento de saída estruturada, rastreamento de profundidade de agentes e gerenciamento de plugins, com aprimoramentos na compatibilidade com VSCode e terminal.
A OpenAI, por meio da Fundação Appia, está avançando em padrões compartilhados para IA avançada, desenvolvendo frameworks de avaliação, práticas de segurança e promovendo a cooperação global.
O Claude Tag permite que equipes marquem @Claude no Slack para delegar tarefas, com acesso a canais selecionados, ferramentas e repositórios de código. Ele aprende com o contexto do canal, funciona de forma assíncrona e toma iniciativa ao atualizar proativamente os usuários sobre informações relevantes. Hoje, 65% do código da equipe de produtos da Anthropic é criado pelo Claude Tag interno, e agora está disponível em beta para clientes do Claude Enterprise e Team.
O GPT-5 Pro forneceu insights cruciais sobre o comportamento das células T, resolvendo um enigma de imunologia de 3 anos. A descoberta pode avançar pesquisas em câncer e doenças autoimunes.
O Mistral OCR 4 introduz caixas delimitadoras, classificação de blocos e escores de confiança inline para 170 idiomas em 10 grupos linguísticos. Ele supera os principais sistemas de OCR nas avaliações de preferência humana com uma taxa de vitória de 72% e alcança a pontuação mais alta no OlmOCRBench (85,20), ao mesmo tempo que oferece implantação auto-hospedada em um único contêiner e suita casos de uso corporativos como RAG e ingestão de documentos.