Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 125

Agrupación de representaciones no supervisadas como defensa contra ataques de envenenamiento en sistemas de clasificación de comandos de voz

Este artículo propone una defensa basada en filtrado contra ataques de envenenamiento con etiquetas sucias en sistemas de clasificación de comandos de voz, agrupando representaciones no supervisadas para identificar y eliminar datos de entrenamiento envenenados.

arxiv arXiv cs.CL · hace 5 h

Más allá de la media: fidelidad en tres ejes para alinear simuladores de encuestas basados en LLM a partir de datos piloto pequeños

Este estudio investiga si los modelos de lenguaje grandes pueden recuperar las características estadísticas de una población más amplia utilizando únicamente una pequeña muestra piloto de respuestas humanas. Los autores descomponen esta recuperación en tres ejes: fidelidad estructural, fidelidad marginal y fidelidad individual.

arxiv arXiv cs.CL · hace 5 h

¿Pueden los LLM contratar con equidad? Sesgo racial en el cribado de currículums

Una auditoría de catorce modelos de lenguaje grandes convencionales revela un cambio significativo en el sesgo racial dentro de los algoritmos de cribado de currículums en los últimos años. Mientras que los modelos de 2023 reproducen brechas a favor de los blancos en las llamadas de retorno, todos los modelos lanzados en 2024 o posterior muestran ya sea brechas nulas o reversiones significativas a favor de los negros.

arxiv arXiv cs.CL · hace 5 h

AgriTune-R: Un marco reproducible para el ajuste fino de LLMs en agricultura

El artículo presenta AgriTune-R, un marco reproducible y auditable diseñado para adaptar modelos de lenguaje grandes de propósito general a aplicaciones agrícolas específicas. Este enfoque aborda la naturaleza específica del dominio y crítica en seguridad de la agricultura integrando gobernanza de datos, evaluación de expertos y restricciones de evidencia para prevenir consejos no confiables.

arxiv arXiv cs.CL · hace 5 h

BERTomelo: Tu mejor amigo codificador en portugués

Este artículo presenta BERTomelo, un codificador monolingüe de próxima generación específicamente optimizado para el idioma portugués utilizando la arquitectura ModernBERT.

arxiv arXiv cs.CL · hace 5 h

Adaptación de dominio conversacional de IndicTrans2 mediante experiencia repetida y sopas de modelos

Los autores adaptan el sistema de traducción de código abierto IndicTrans2-1B para manejar el registro conversacional en 21 idiomas indios utilizando únicamente conjuntos de datos públicos. Al combinar la experiencia repetida con la sopa de modelos, logran mejoras significativas en las métricas automáticas sin degradar el rendimiento en tareas de dominio general.

arxiv arXiv cs.CL · hace 5 h

La fuerza de la evidencia clínica es recuperable a partir de las representaciones de LLM, no de los grados declarados

Un estudio de 22 modelos de lenguaje grandes de peso abierto revela que, si bien la fuerza de la evidencia clínica puede recuperarse a partir de las activaciones y el texto del modelo, los grados explícitamente declarados por los modelos no son mejores que el azar. Los investigadores analizaron 45.134 afirmaciones clínicas armonizadas en cuatro niveles de grados de evidencia para probar si los modelos registran y expresan la fuerza de la evidencia de manera distinta a la verdad factual.

arxiv arXiv cs.CL · hace 6 h

¿Cómo aprovechar el habla sintética para sistemas ASR basados en LLM?

Los investigadores investigan la brecha distribucional entre el habla sintética y real en sistemas de reconocimiento automático del habla (ASR) basados en LLM, analizando una arquitectura SLAM-ASR. Identifican que las señales discriminativas que separan ambos tipos de datos se concentran en las capas iniciales a medias del backbone del modelo.

arxiv arXiv cs.CL · hace 6 h

Descodificación difusa enmascarada como flujo de predicción x

Este artículo presenta un marco de descodificación continua para modelos de lenguaje de difusión enmascarada (MDLMs) que reinterpretar la predicción de máscaras como predicción de estado limpio para inducir un flujo continuo en el espacio de incrustaciones de entrada. Al permitir que los tokens acumulen progreso parcial y permanezcan revisables, el método aborda los compromisos prematuros inherentes a los regímenes estándar de desenmascaramiento binario.

arxiv arXiv cs.CL · hace 6 h

ThinkProbe: Perfilado estructural del razonamiento de LLM mediante grafos de pensamiento no generativos

ThinkProbe es un marco para el análisis estructural de las trazas de razonamiento de modelos de lenguaje grandes, convirtiéndolas en Grafos de Pensamiento dirigidos con ocho tipos de nodos y seis tipos de aristas. Deriva un perfil cognitivo de cinco dimensiones basado en 19 métricas a través de una pipeline completamente no generativa que combina segmentación basada en reglas y vinculación semántica discriminativa.

arxiv arXiv cs.CL · hace 6 h

Un estudio comparativo sobre las señales afectivas en incrustaciones de texto a través de teorías psicológicas de la emoción

Este estudio investiga el grado en que los codificadores de texto modernos capturan teorías psicológicas del afecto evaluando doce modelos lanzados recientemente a través de tres marcos de emoción establecidos. La investigación compara el rendimiento a nivel de palabra y a nivel de oración utilizando tanto tareas de regresión como de clasificación.

arxiv arXiv cs.CL · hace 6 h

Explicaciones localizadas basadas en conceptos de bajo costo: ¿hasta dónde podemos llegar con enfoques sin entrenamiento?

Este estudio evalúa si los Modelos de Lenguaje Multimodal a gran escala (MLLMs) pueden realizar la denominación localizada de conceptos bajo condiciones estrictas de zero-shot, asignando etiquetas a regiones de cajas delimitadoras. Los autores proponen un protocolo de evaluación reproducible para la Denominación de Conceptos que incluye prompts de conjunto cerrado y una estrategia basada en similitud de incrustaciones para espacios de etiquetas grandes.

arxiv arXiv cs.CL · hace 6 h

Ajuste fino evolutivo: Aprender a descubrir en 371 tareas de optimización

Los investigadores presentan el Ajuste Fino Evolutivo (EFT), un paradigma de entrenamiento intermedio que enseña a los Modelos de Lenguaje Grandes a evolucionar soluciones en diversas tareas, convirtiendo trayectorias de búsqueda evolutiva en supervisión. Este enfoque aborda la limitación de métodos anteriores que descartan la experiencia acumulada, permitiendo a los modelos reutilizar capacidades de descubrimiento en lugar de resolver nuevos problemas desde cero.

arxiv arXiv cs.CL · hace 6 h

AB-RAG: Generación Aumentada por Recuperación con Presupuesto Adaptativo para Respuestas a Preguntas Confiables

AB-RAG es un marco de trabajo libre de entrenamiento y agnóstico al backbone que ajusta dinámicamente los esfuerzos de recuperación basándose en una estimación de confianza derivada de la certeza del modelo, el acuerdo entre la respuesta y la evidencia recuperada, y la varianza de las puntuaciones de recuperación. Este enfoque permite a los sistemas decidir si detenerse o recuperar más evidencia dentro de un presupuesto fijo sin reentrenar el modelo de lenguaje subyacente.

arxiv arXiv cs.CL · hace 6 h

La profundidad representacional de la conciencia de evaluación cambia con la escala en modelos de lenguaje de peso abierto

Este estudio investiga si los modelos de lenguaje reconocen cuándo están siendo evaluados, un factor crítico para la seguridad de la IA ya que puede hacer que los modelos alteren su comportamiento estratégicamente. Utilizando 11 modelos de peso abierto de las familias Qwen 2.5, Gemma 2 y Llama 3.2, los investigadores analizaron cómo se manifiesta la conciencia de evaluación en diferentes tamaños de modelo.

arxiv arXiv cs.CL · hace 7 h

Regla de cribado pre-registrada para bucles externos evolutivos

Los autores presentan una regla de cribado pre-registrada que determina antes de la implementación si vale la pena construir un bucle externo evolutivo sobre los parámetros de una red neuronal en comparación con una alternativa barata de un solo disparo. La regla calcula una métrica de recuperación R, definida como la mejor ganancia de un solo disparo dividida por la mejor ganancia de cualquier método barato, y prescribe omitir el bucle externo cuando R es mayor o igual al 90%.

arxiv arXiv cs.CL · hace 7 h

Cómo el lenguaje antropomórfico impacta las percepciones públicas de la IA

Un estudio con 815 participantes examinó si usar un lenguaje similar al humano para describir la inteligencia artificial altera la percepción pública en comparación con descripciones neutrales.

arxiv arXiv cs.CL · hace 7 h

DistilledGemma: Eficiencia y precisión equilibradas para la extracción de relaciones persona-lugar

Los autores presentan DistilledGemma, un sistema eficiente para la extracción de relaciones persona-lugar a partir de artículos de periódicos históricos multilingües en inglés, alemán y francés. El enfoque utiliza una tubería de destilación de conocimiento en tres etapas para equilibrar la precisión de clasificación con la eficiencia computacional.

arxiv arXiv cs.CL · hace 7 h

Atribución de Datos Mecanística Simbólica: Rastreando la Influencia del Entrenamiento hacia Políticas Conductuales Aprendidas

Los autores presentan Atribución de Datos Mecanística Simbólica (SMDA), un marco que atribuye pares de entrenamiento a las políticas simbólicas interpretables que gobiernan el comportamiento del modelo, cerrando la brecha entre los circuitos mecanísticos y las decisiones de alto nivel.

arxiv arXiv cs.CL · hace 7 h

Retención selectiva de memoria para agentes LLM de largo horizonte

El artículo presenta TraceRetain, un marco ligero para memoria externa acotada en agentes LLM congelados que puntúa y elimina entradas basándose en características interpretables como éxito y redundancia. El estudio evalúa cómo las políticas de retención impactan el rendimiento cuando se utiliza memoria externa para aumentar los modelos de lenguaje.