Tous les articles
lab Microsoft Research Blog · il y a 7 j

Comprendre le cerveau grâce à des explications et expériences pilotées par l'IA

Les chercheurs ont développé les Tests Causaux Génératifs (GCT), un cadre qui traduit des modèles de prédiction cérébrale basés sur des LLM non interprétables en hypothèses verbales concises et testables sur la fonction corticale. Cette méthode condense les paramètres du modèle en courtes phrases décrivant à quoi répondent des régions cérébrales spécifiques, comme la « préparation alimentaire », puis vérifie ces explications par le biais d'expériences IRMf ciblées.

lab Hugging Face Blog · il y a 7 j

Analyse de la précision de prédiction des tokens dans les modèles linguistiques hybrides

Une étude récente examine quels tokens spécifiques sont prédits plus précisément par les modèles linguistiques hybrides par rapport aux architectures denses standard. La recherche se concentre sur la compréhension de la distribution des erreurs de prédiction à travers différents types de tokens, tels que les mots rares et les extraits de code. En analysant les paysages de perte, les auteurs identifient que les modèles hybrides excellent à capturer les dépendances à longue portée dans les régions de données clairsemées. Les résultats suggèrent que le mécanisme de mélange d'experts permet une utilisation plus efficace des paramètres lors de l'inférence. Cette précision améliorée est particulièrement notable pour les tokens de faible fréquence dans le corpus d'entraînement. L'article fournit une décomposition détaillée des métriques de performance sur divers ensembles de données de référence. Ces résultats mettent en évidence le potentiel des architectures hybrides pour gérer efficacement des structures linguistiques diverses.

lab Cohere Blog · il y a 7 j

Cohere automatise la réponse aux incidents avec North et Wiz via un serveur MCP personnalisé

Cohere a développé un agent de sécurité en utilisant sa plateforme d'IA entreprise, Cohere North, intégrée à la plateforme de sécurité cloud Wiz via un serveur Model Context Protocol (MCP) personnalisé. Cette architecture relie North à l'API GraphQL de Wiz via huit outils atomiques, permettant des workflows de réponse aux incidents automatisés à partir d'une seule invite. Le système effectue une analyse du rayon d'explosion des combinaisons toxiques en évaluant les chaînes d'attaque et en classant les risques en fonction de l'exposition internet et des niveaux de privilège en environ 20 secondes. Il automatise également l'enquête de bout en bout en récupérant les détails des problèmes, en créant des tickets Linear, en mettant à jour le statut de Wiz et en rédigeant des rapports structurés de réponse aux incidents. De plus, une automatisation hebdomadaire planifiée génère un bref sur la posture de sécurité chaque lundi matin sans intervention manuelle. Cette intégration élimine la boucle de tri précédente de 30 minutes à deux heures par découverte, permettant aux ingénieurs de se concentrer sur l'évaluation des analyses plutôt que sur les alertes brutes.