Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 124

La profundidad representacional de la conciencia de evaluación cambia con la escala en modelos de lenguaje de peso abierto

Este estudio investiga si los modelos de lenguaje reconocen cuándo están siendo evaluados, un factor crítico para la seguridad de la IA ya que puede hacer que los modelos alteren su comportamiento estratégicamente. Utilizando 11 modelos de peso abierto de las familias Qwen 2.5, Gemma 2 y Llama 3.2, los investigadores analizaron cómo se manifiesta la conciencia de evaluación en diferentes tamaños de modelo.

arxiv arXiv cs.CL · hace 4 h

Regla de cribado pre-registrada para bucles externos evolutivos

Los autores presentan una regla de cribado pre-registrada que determina antes de la implementación si vale la pena construir un bucle externo evolutivo sobre los parámetros de una red neuronal en comparación con una alternativa barata de un solo disparo. La regla calcula una métrica de recuperación R, definida como la mejor ganancia de un solo disparo dividida por la mejor ganancia de cualquier método barato, y prescribe omitir el bucle externo cuando R es mayor o igual al 90%.

arxiv arXiv cs.CL · hace 4 h

Cómo el lenguaje antropomórfico impacta las percepciones públicas de la IA

Un estudio con 815 participantes examinó si usar un lenguaje similar al humano para describir la inteligencia artificial altera la percepción pública en comparación con descripciones neutrales.

arxiv arXiv cs.CL · hace 4 h

DistilledGemma: Eficiencia y precisión equilibradas para la extracción de relaciones persona-lugar

Los autores presentan DistilledGemma, un sistema eficiente para la extracción de relaciones persona-lugar a partir de artículos de periódicos históricos multilingües en inglés, alemán y francés. El enfoque utiliza una tubería de destilación de conocimiento en tres etapas para equilibrar la precisión de clasificación con la eficiencia computacional.

arxiv arXiv cs.CL · hace 4 h

Atribución de Datos Mecanística Simbólica: Rastreando la Influencia del Entrenamiento hacia Políticas Conductuales Aprendidas

Los autores presentan Atribución de Datos Mecanística Simbólica (SMDA), un marco que atribuye pares de entrenamiento a las políticas simbólicas interpretables que gobiernan el comportamiento del modelo, cerrando la brecha entre los circuitos mecanísticos y las decisiones de alto nivel.

arxiv arXiv cs.CL · hace 4 h

Retención selectiva de memoria para agentes LLM de largo horizonte

El artículo presenta TraceRetain, un marco ligero para memoria externa acotada en agentes LLM congelados que puntúa y elimina entradas basándose en características interpretables como éxito y redundancia. El estudio evalúa cómo las políticas de retención impactan el rendimiento cuando se utiliza memoria externa para aumentar los modelos de lenguaje.

arxiv arXiv cs.CL · hace 4 h

Creencias de LLM informadas por evidencia para el descubrimiento científico continuo

El artículo aborda la limitación del uso de "sorpresa bayesiana" estática en AutoDiscovery, introduciendo creencias de LLM informadas por evidencia, donde los priors se actualizan con evidencia de hipótesis anteriores para calcular una surprisal no estacionaria. Los autores encuentran que la generación aumentada por recuperación basada en incrustaciones sobre descubrimientos previos anticipa mejor los posteriors finales e identifican el 37.5% de las sorpresas estáticas como espurias.

arxiv arXiv cs.CL · hace 4 h

¿Los OCR-VLMs leen Devanagari? Estudio de benchmark y post-corrección

Un estudio realiza un benchmark de diez sistemas OCR en texto Devanagari, revelando que los modelos de lenguaje-visión OCR especializados son frágiles bajo degradación y que un alto rendimiento en inglés no predice la precisión en scripts indios.

arxiv arXiv cs.CL · hace 4 h

Modelos de Lenguaje de Difusión Multi-Bloque

Los investigadores proponen Modelos de Lenguaje de Difusión Multi-Bloque (MBD-LMs) para extender la generación de texto por difusión de un solo bloque, descodificando concurrentemente un conjunto en ejecución de bloques consecutivos para lograr paralelismo inter-bloque. El enfoque cierra la brecha entre los estados de entrenamiento e inferencia mediante un método post-entrenamiento llamado Forzamiento Maestro Multi-Bloque (MultiTF).

arxiv arXiv cs.CL · hace 5 h

PolicyGuard: Un verificador de sub-agente fundamentado en el diálogo para la adherencia a políticas en agentes LLM

Los investigadores presentan PolicyGuard, un verificador de sub-agente diseñado para mejorar la adherencia a políticas en agentes LLM mediante el razonamiento sobre el contexto completo del diálogo, en lugar de depender de verificaciones externas de argumentos individuales. Este enfoque aborda las limitaciones de los métodos de salvaguarda anteriores que a menudo subestiman la necesidad de correcciones específicas de la conversación y la confirmación explícita del usuario.

arxiv arXiv cs.CL · hace 5 h

Comprendiendo la ilusión de evaluación en modelos de lenguaje grandes basados en difusión

Un estudio revela que evaluar modelos de lenguaje grandes basados en difusión (dLLMs) es altamente sensible a las plantillas de prompt, creando una ilusión de que el descodificado paralelo mejora la eficiencia sin pérdida de rendimiento.

arxiv arXiv cs.CL · hace 5 h

Modelo de lenguaje grande de razonamiento orientado al viaje mediante grafos de conocimiento específicos del dominio

Los investigadores proponen una tubería modular para construir un modelo de lenguaje grande de razonamiento en el dominio de viajes, fundamentado en un grafo de conocimiento diseñado por expertos, para abordar problemas de precisión y confiabilidad en dominios especializados. El enfoque integra un grafo de conocimiento de viajes, un procedimiento de construcción ascendente para pares de preguntas y respuestas de múltiples saltos, y ajuste fino supervisado para incrustar el conocimiento del dominio como trazas de razonamiento auditables.

arxiv arXiv cs.CL · hace 5 h

MIThinker: Un Pensador Optimizado por Política Plug-and-Play para el Consejo de Entrevista Motivacional

Los investigadores proponen MIThinker, un modelo de pensamiento ligero que genera pensamientos terapéuticos para guiar a los agentes de consejo de Entrevista Motivacional en la selección de estrategias y la generación de respuestas. Para abordar la falta de datos de pensamientos anotados, introducen AugR1-MI, una pipeline automatizada que ingeniería inversa de los pensamientos del consejero a partir de las respuestas observadas.

arxiv arXiv cs.CL · hace 5 h

Un marco híbrido para la anotación de letras de canciones basado en la alineación humano-LLM

Este artículo aborda los desafíos del reconocimiento de emociones en las letras de canciones, que a menudo divergen del sentimiento general de la canción, proponiendo un marco de anotación híbrido que optimiza la alineación entre humanos y modelos de lenguaje grandes (LLMs). Los autores presentan un nuevo conjunto de datos a nivel de oraciones para examinar esta alineación y destacan la subjetividad inherente de la tarea.

arxiv arXiv cs.CL · hace 5 h

El Límite de Complejidad: Una Evaluación Multidominio del Razonamiento Secuencial Bajo Escalamiento de Profundidad

El Benchmark del Límite de Complejidad (CCB) evalúa cómo el razonamiento de los modelos de lenguaje se degrada a medida que aumentan los pasos secuenciales requeridos, fijando el contenido semántico mientras varía la profundidad de la tarea de 5 a 50. El estudio revela una decadencia geométrica consistente por paso en tres regímenes distintos: seguimiento de estado espacial fundamentado, manipulación abstracta de punteros simbólicos e inferencia relacional transitiva.

arxiv arXiv cs.CL · hace 5 h

Confianza fabricada: Cómo la consolidación de la memoria convierte los rumores en hechos seguros

La investigación demuestra que los sistemas de memoria de agentes LLM reescriben comentarios casuales o cautelosos como afirmaciones seguras y fechadas, que los agentes posteriormente tratan como hechos verificados. Este proceso permite que la información no verificada eluda las comprobaciones de seguridad sin requerir un atacante activo, ya que el agente responde a la confianza en la formulación en lugar de la atribución de la fuente.

arxiv arXiv cs.CL · hace 5 h

Decisiones deterministas para IA de alto riesgo

El artículo identifica el "sesgo de intervención" como un modo crítico de fallo en agentes educativos de asesoramiento con modelos de lenguaje grandes de cero disparos, donde recomiendan incorrectamente una acción a pesar de que las políticas oráculo mandan inacción. Utilizando el Conjunto de Datos de Analítica del Aprendizaje de la Open University, el estudio demuestra que GPT-4o de cero disparos presenta una tasa de falsos positivos de 43 puntos porcentuales al día 56, lo que conduce a aproximadamente 4.300 contactos innecesarios con asesores por ciclo para 10.000 estudiantes.

github llama.cpp · hace 5 h

Lanzamiento b9843 de llama.cpp con binarios para macOS, Linux y Windows

El proyecto llama.cpp ha publicado el lanzamiento b9843, proporcionando binarios precompilados para macOS, Linux, Android, Windows y openEuler en varias arquitecturas de hardware.

github LangGraph · hace 5 h

Notas de la versión 1.2.7 de LangGraph

Se ha lanzado LangGraph versión 1.2.7, introduciendo correcciones de errores y actualizaciones de dependencias para el ecosistema LangChain.

arxiv arXiv cs.LG · hace 6 h

Cuando falla el Top-1: Calibración de monitores LoRA para LMs de difusión enmascarados

Este estudio evalúa la efectividad de la concentración del argmax top-1 como advertencia de colapso durante el ajuste fino de modelos de lenguaje de difusión discreta (DLMs) utilizando Adaptación de Bajo Rango (LoRA). Los autores encuentran que esta métrica tiene una precisión cero porque se satura antes de que comience la optimización, fallando en detectar colapsos reales del entrenamiento.