Todos los artículos
arxiv arXiv cs.AI · hace 15 d

FusionRS: Primer conjunto de datos a gran escala de teledetección RGB-infrarrojo

FusionRS presenta el primer conjunto de datos a gran escala RGB-infrarrojo-texto para la modelización de visión-lenguaje en teledetección. Alinea imágenes RGB e infrarrojas con descripciones conscientes del infrarrojo, permitiendo modelos de base de visión-lenguaje bimodales. Los experimentos muestran una mejora en la alineación RGB-IR, recuperación y generación de descripciones, con estudios de ablación que confirman el papel crítico de la supervisión textual específica de la modalidad.

arxiv arXiv cs.AI · hace 15 d

HAMON: Pronóstico óptico pasivo para series temporales de largo plazo

HAMON utiliza componentes ópticos pasivos para realizar pronósticos de series temporales de largo plazo, superando a los mejores modelos digitales en ETTm2 en todos los horizontes y en ETTh2 en todos excepto el horizonte más largo. Logra hasta un 14% menos de MSE y se basa en la propagación óptica física sin capas digitales entrenables, demostrando que la mezcla óptica pasiva puede producir pronósticos competitivos.

media Latent Space · hace 15 d

Satya Nadella sobre Loopcraft y ecosistemas de vanguardia

El CEO de Microsoft, Satya Nadella, presenta 'Loopcraft' como una nueva teoría de la empresa, enfatizando que la verdadera oportunidad en la IA no radica en seleccionar el mejor modelo, sino en construir bucles de aprendizaje que acumulen capital humano y de tokens. Afirma que la prioridad debe ser crear ecosistemas de vanguardia donde cada organización pueda poseer y desarrollar su conocimiento institucional, permitiendo un amplio flujo de valor a través de industrias y países.

media r/LocalLLaMA · hace 15 d

vLLM lanza un nuevo analizador de transmisión para Qwen3+ en la versión nocturna

vLLM ha introducido un nuevo analizador de transmisión para Qwen3+ disponible en su compilación nocturna, abordando problemas como la detención intermedia y las llamadas a herramientas de transmisión fallidas debido a los límites de fragmentos. La actualización reportedly resuelve estos problemas en pruebas limitadas, mejorando la fiabilidad para flujos de trabajo agénticos.

media r/LocalLLaMA · hace 15 d

HalBench evalúa 29 modelos de código abierto en sicolofía y alucinación

HalBench evalúa 29 LLMs de código abierto en un benchmark personalizado para sicolofía y alucinación. Qwen 3.6 y Gemma 4 superan a modelos más grandes, con Qwen 3.6 logrando un 36.6% de resistencia—más alto que GPT-5.4 y Gemini 3.1 Pro. El tamaño del modelo no se correlaciona con respuestas honestas, lo que indica que la arquitectura y los datos de entrenamiento importan más que los parámetros.

blog Simon Willison · hace 15 d

datasette-agent 0.3a0 se lanza con aprobación del usuario para operaciones de escritura en SQL

datasette-agent 0.3a0 introduce la herramienta execute_write_sql que solicita a los usuarios antes de escribir en las bases de datos, asegurando que se respeten las comprobaciones de permisos. La actualización también mejora el chat del agente datasette con soporte para aprobación del usuario, nuevas opciones de comando como --unsafe para autoaprobación y salidas de herramientas en texto plano para la visualización en CLI.