Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 62

Auditoría de la inestabilidad conductual sensible al encuadre en LLMs para salud mental

Este estudio investiga cómo las preocupaciones semánticamente similares presentadas a través de diferentes encuadres contextuales elicitan respuestas variables en modelos de lenguaje grandes ajustados por instrucciones, desafiando potencialmente la fiabilidad del sistema. Utilizando prompts controlados emparejados y análisis de sondeo capa por capa, los autores demuestran que el encuadre altera sistemáticamente las tendencias de respuesta interpretativa a través de múltiples arquitecturas de modelos.

arxiv arXiv cs.CL · hace 5 h

ReaORE: Extracción de relaciones abiertas progresivas guiadas por razonamiento potenciada por modelos de razonamiento grandes

Los investigadores proponen ReaORE, un marco para la extracción de relaciones abiertas que utiliza modelos de razonamiento grandes para lograr una generalización confiable a tipos de relaciones no vistos. El método aborda las limitaciones de los enfoques actuales de agrupamiento y generación directa mediante un proceso de razonamiento de grueso a fino.

arxiv arXiv cs.CL · hace 5 h

¿Dónde encuentran la felicidad los modelos? Vectores de emoción en LLMs de código abierto

Este estudio investiga la presencia y estructura de vectores de emoción en modelos de lenguaje grandes de peso abierto, específicamente Apertus-8B-Instruct-2509 y Gemma-4-E4B-it. La investigación confirma que estos modelos codifican la geometría de la valencia con una alta correlación a las estructuras psicológicas humanas, acercándose a los niveles previamente observados en Claude Sonnet 4.5.

arxiv arXiv cs.CL · hace 5 h

MinGram: Un tokenizador unigrama minimalista con alta compresión y alineación morfológica competitiva

Los autores presentan MinGram, un tokenizador unigrama minimalista que simplifica el entrenamiento mediante el uso de un vocabulario inicial derivado de BPE, Hard EM en un camino de mínimo número de tokens y una única etapa de poda de puntuación plana. Este enfoque elimina la necesidad de matrices de sufijos, pasadas forward-backward y bucles iterativos de poda, haciendo que el procedimiento sea significativamente menos complejo que los métodos estándar.

arxiv arXiv cs.CL · hace 5 h

Mejora de la calibración de incertidumbre verbalizada en VQA médica

Este trabajo aborda la tendencia de los modelos de lenguaje multimodales grandes a producir salidas excesivamente seguras en la Respuesta Visual Médica a Preguntas, proponiendo un marco basado en entrenamiento que ajusta finamente estos modelos para una mejor calibración. El método emplea una función de pérdida compuesta que combina calibración estilo Brier, regularización de anclas, alineación contrasteiva de imagen-texto y términos de divergencia KL para alinear la confianza del modelo con la corrección real.

arxiv arXiv cs.CL · hace 5 h

Mejora de agentes de interpretación de roles generales mediante razonamiento basado en psicología y optimización de políticas consciente del rol

Los investigadores proponen Psy-CoT, un marco de cadena de pensamiento fundamentado en la psicología que descompone el razonamiento previo a la respuesta en Percepción de Interacción, Empatía Psicológica y Construcción Lógica para mejorar la fidelidad del personaje. Para abordar la desalineación de gradientes en el aprendizaje por refuerzo, introducen Optimización de Políticas Consciente del Rol (RAPO), que utiliza la información mutua entre tokens de perfil para ponderar los gradientes de forma asimétrica.

arxiv arXiv cs.CL · hace 5 h

NuclearQAv2: Un benchmark estructurado para evaluar la competencia en ciencias del dominio en modelos de lenguaje grandes

Los investigadores presentan NuclearQAv2, un nuevo benchmark diseñado para evaluar la fiabilidad de los modelos de lenguaje grandes en ingeniería nuclear mediante pruebas de conocimiento factual, razonamiento cuantitativo y comprensión conceptual.

arxiv arXiv cs.CL · hace 7 h

Hacia una Varianza Adjudicativa Explicable: Cuantificación de la Discreción Judicial mediante Aprendizaje Multi-Tarea con Puertas

Los investigadores proponen una arquitectura de Aprendizaje Multi-Tarea con Puertas Consciente del Juez que desentraña los hechos objetivos del caso del contexto adjudicativo para mejorar la predicción de resultados legales. El modelo utiliza una taxonomía de resultados de gran detalle y un mecanismo de fusión con puertas para modular dinámicamente la dependencia de la identidad del juez, evaluado en 13,937 decisiones de los Tribunales de Empleo del Reino Unido.

arxiv arXiv cs.CL · hace 7 h

El acertijo del acertijo: evaluando el razonamiento flexible en modelos de lenguaje grandes y humanos

Un estudio introduce el paradigma "acertijo del acertijo" para determinar si los modelos de lenguaje grandes (LLMs) dependen del razonamiento flexible o del emparejamiento de patrones, revelando que los humanos y los LLMs fallan en direcciones opuestas. En experimentos que involucraron a nueve LLMs de última generación y 100 participantes humanos, los LLMs tuvieron un rendimiento significativamente peor en acertijos del acertijo que en acertijos genuinos, mientras que los humanos mostraron la tendencia inversa.

arxiv arXiv cs.CL · hace 7 h

HarmVideoBench: Evaluación de la comprensión de videos dañinos en modelos multimodales grandes

Los investigadores presentan HarmVideoBench, un benchmark diagnóstico multicapa diseñado para evaluar la capacidad de los modelos de visión y lenguaje grandes (VLM) para comprender videos dañinos más allá de las señales superficiales. El benchmark aborda limitaciones en trabajos existentes al incorporar razonamientos explicativos y evaluar tres dimensiones jerárquicas del daño: Evidencia Observable, Significado Interno del Clip y Razonamiento Más Allá del Clip.

arxiv arXiv cs.CL · hace 7 h

Pronóstico con LLM: Generalización mejorada mediante dirección de características

Este estudio aplica Modelos de Lenguaje Grande a tareas de pronóstico y utiliza autoencoders dispersos para analizar sus estados internos, distinguiendo entre conocimiento específico del tiempo y patrones generalizables. La investigación identifica características específicas asociadas tanto con el razonamiento consciente del tiempo como con el sesgo de anticipación.

arxiv arXiv cs.CL · hace 7 h

La actualización de creencias sintácticas como motor de la dificultad en el procesamiento de oraciones de sendero del jardín

El artículo propone la Actualización de Creencias Sintácticas, un modelo que predice la dificultad de procesamiento en oraciones de sendero del jardín midiendo la magnitud de las actualizaciones de creencias sintácticas mediante la divergencia de Rényi generalizada. Este enfoque supera a la sorpresa léxica al proporcionar un mejor ajuste a los datos de tiempo de lectura humana.

arxiv arXiv cs.CL · hace 7 h

Caminos con Intenciones Reales: El Entrenamiento Consciente de la Intención Mejora la Clasificación de Seguridad de LLMs en Diversos Regímenes de Entrenamiento

Los autores presentan AIMS, un conjunto de datos de 1.724 prompts de seguridad difíciles anotados por humanos, emparejados con descripciones de intención y etiquetas de daño, para evaluar el entrenamiento consciente de la intención en múltiples regímenes. Argumentan que modelar la intención del usuario como una señal explícita mejora significativamente la robustez de los clasificadores de seguridad.

arxiv arXiv cs.CL · hace 7 h

Preguntar, no juzgar: preguntas binarias para la evaluación y auto-mejora interpretable de LLM

Los autores proponen BINEVAL, un marco que descompone los criterios de evaluación en preguntas binarias atómicas para proporcionar puntuaciones multidimensionales e interpretables para modelos de lenguaje grandes. Este enfoque genera retroalimentación transparente a nivel de pregunta y puntuaciones generales calibradas al hacer que un LLM responda preguntas de evaluación detalladas de forma independiente para cada salida.

blog Simon Willison · hace 7 h

datasette-export-database 0.3a2 corrige el bloqueo de versión

La versión 0.3a2 del plugin datasette-export-database aborda un problema de compatibilidad causado por una restricción de dependencia demasiado estricta en la versión anterior.

github llama.cpp · hace 7 h

la versión b9827 de llama.cpp añade una optimización de copia asíncrona 2D en CUDA

La versión b9827 de llama.cpp introduce una optimización de rendimiento para CUDA añadiendo un camino rápido cudaMemcpy2DAsync a la función ggml_cuda_cpy. Este cambio acelera las copias escalonadas de mismo tipo y misma forma donde los tensores no son completamente contiguos pero cada fila es contigua, reemplazando kernels de copia escalar elemento por elemento más lentos.

media r/LocalLLaMA · hace 8 h

BatonBot: Flujo de trabajo Kanban local de código abierto para agentes de codificación con IA

El autor presenta BatonBot, una aplicación local-first de código abierto diseñada para optimizar los flujos de trabajo de codificación con IA al reducir la necesidad de supervisión constante por parte del usuario. La herramienta aborda la ineficiencia de las interacciones secuenciales de agentes permitiendo a los usuarios configurar tareas y rastrear el progreso visualmente en un tablero estilo Kanban.

media r/LocalLLaMA · hace 8 h

audio.cpp: 12 modelos de audio en un solo entorno de ejecución C++ con hasta 5x de mejora de velocidad

El proyecto de código abierto audio.cpp proporciona un marco de inferencia nativo en C++ para modelos de audio basados en ggml, que actualmente admite 12 familias de modelos lanzadas, incluyendo TTS, ASR y conversión de voz. Las pruebas de rendimiento en Ubuntu/CUDA demuestran que el rendimiento de texto a voz en este entorno de ejecución es hasta 5 veces más rápido que las implementaciones de referencia correspondientes en Python.

blog Simon Willison · hace 8 h

Bruce Schneier sobre la responsabilidad de la IA y el fallo alemán

Bruce Schneier analiza un reciente fallo alemán que considera a Google responsable por errores en sus resúmenes de IA, argumentando que los agentes de IA deben ser tratados como agentes de la organización que los despliega.

media r/LocalLLaMA · hace 8 h

JetSpec: El descodificado especulativo con redacción paralela de árboles permite una aceleración de inferencia LLM sin pérdidas de hasta 9.64x

JetSpec introduce un método de descodificación especulativa llamado redacción causal de árboles en paralelo que co-optimiza el costo y la calidad del borrador para reducir la latencia de generación de LLM. El enfoque logra una aceleración end-to-end de hasta 9.64x en MATH-500 y 4.58x en chat abierto mientras mantiene la precisión sin pérdidas.