Todos os artigos
lab Microsoft Research Blog · há 7 d

Compreendendo o cérebro com explicações e experimentos orientados por IA

Pesquisadores desenvolveram o Teste Causal Generativo (GCT), uma estrutura que traduz modelos de previsão cerebral baseados em LLMs, não interpretáveis, em hipóteses verbais concisas e testáveis sobre a função cortical. Este método resume os parâmetros do modelo em frases curtas descrevendo a quais regiões específicas do cérebro elas respondem, como "preparação de alimentos", e então verifica essas explicações por meio de experimentos de fMRI direcionados.

lab Hugging Face Blog · há 7 d

Análise da Precisão de Predição de Tokens em Modelos de Linguagem Híbridos

Um estudo recente investiga quais tokens específicos são previstos com mais precisão por modelos de linguagem híbridos em comparação com arquiteturas densas padrão. A pesquisa foca em entender a distribuição dos erros de previsão entre diferentes tipos de tokens, como palavras raras e trechos de código. Ao analisar as paisagens de perda, os autores identificam que os modelos híbridos se destacam na captura de dependências de longo alcance em regiões de dados esparsos. Os achados sugerem que o mecanismo de mistura de especialistas permite uma utilização mais eficiente dos parâmetros durante a inferência. Essa precisão aprimorada é particularmente notável para tokens com baixa frequência no corpus de treinamento. O artigo fornece uma análise detalhada das métricas de desempenho em vários conjuntos de dados de benchmark. Esses resultados destacam o potencial das arquiteturas híbridas para lidar efetivamente com estruturas linguísticas diversas.

lab Cohere Blog · há 7 d

Cohere automatiza resposta a incidentes com North e Wiz por meio de servidor MCP personalizado

A Cohere desenvolveu um agente de segurança usando sua plataforma de IA corporativa, Cohere North, integrada à plataforma de segurança em nuvem Wiz por meio de um servidor Model Context Protocol (MCP) personalizado. Essa arquitetura conecta o North à API GraphQL da Wiz por meio de oito ferramentas atômicas, permitindo fluxos automatizados de resposta a incidentes a partir de um único prompt. O sistema realiza análise do raio de explosão de combinações tóxicas avaliando cadeias de ataque e classificando riscos com base na exposição à internet e nos níveis de privilégio em aproximadamente 20 segundos. Ele também automatiza a investigação de ponta a ponta, recuperando detalhes do problema, criando tickets no Linear, atualizando o status da Wiz e redigindo relatórios estruturados de Resposta a Incidentes. Além disso, uma automação semanal agendada gera um resumo da postura de segurança toda segunda-feira pela manhã sem intervenção manual. Essa integração elimina o ciclo de triagem anterior de 30 minutos a duas horas por achado, permitindo que os engenheiros se concentrem na avaliação das análises em vez de alertas brutos.

media Hugging Face Forums · há 7 d

Discussão sobre o Ajuste Fino de Modelos de Linguagem Pequenos com Baixo Custo em 2026

Uma recente discussão nos fóruns da Hugging Face explora os métodos mais eficientes para personalizar pequenos modelos de IA para tarefas específicas. O tópico, intitulado "Qual é a maneira mais econômica de ajustar finamente um modelo de linguagem pequeno em 2026?", busca conselhos sobre como minimizar despesas enquanto mantém o desempenho. Foi iniciado por um único participante que visa otimizar seu fluxo de trabalho para aplicações especializadas. A pergunta destaca o crescente interesse em aproveitar modelos menores para reduzir a sobrecarga computacional. Os participantes são encorajados a compartilhar estratégias que equilibrem custo e eficiência no cenário atual. Este tópico reflete os esforços contínuos para tornar a adaptação de modelos mais acessível e econômica.