Todos los artículos
lab Anthropic News · ahora mismo En vivo

Claude Science, un banco de trabajo de IA para científicos, ya está disponible

Anthropic ha lanzado Claude Science en beta, un banco de trabajo de IA diseñado para integrar herramientas científicas fragmentadas en un único entorno de investigación. La plataforma tiene como objetivo acelerar el descubrimiento proporcionando artefactos auditables, escalado flexible de recursos de cómputo y agentes especializados para dominios como la genómica y la biología estructural.

lab OpenAI News · hace 1 h En vivo

Presentamos GeneBench-Pro

GeneBench-Pro es una evaluación a nivel de investigación diseñada para medir cómo los agentes de IA manejan la ambigüedad y toman decisiones trascendentales en biología computacional, ampliando el GeneBench original. Aborda la limitación de las evaluaciones actuales al probar capacidades de orden superior como manejar ruido en los datos, revisar supuestos y determinar cuándo los resultados están listos para la toma de decisiones.

media r/LocalLLaMA · hace 3 h

Notas sobre FastContext de Microsoft y un pequeño experimento de SWE-QA con pistas de recuperación

El autor analiza el artículo de Microsoft sobre FastContext y presenta un enfoque alternativo que utiliza búsqueda semántica fuera de línea para reducir el uso de tokens en agentes de codificación. Al indexar los repositorios por adelantado y proporcionar pistas de rango de archivos a Claude Code, el método logró una reducción del 43,8% en el total de tokens mientras mantenía una calidad de solución equivalente en SWE-QA.