Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 57

Presentación de los corpus Hlava Cor y Hlava AD: Variación humana en la coreferencia y las relaciones discursivas

Los investigadores han creado dos nuevos corpus, Hlava Cor y Hlava AD, para explorar la variación humana en la comprensión de la coherencia textual. Estos recursos contienen múltiples anotaciones de textos checos junto con las explicaciones de los anotadores sobre sus elecciones. El primer corpus, Hlava Cor, consta de 1,024 contextos anotados por tres personas para capturar las diferencias en la identificación de la coreferencia. Cubre pronombres, sintagmas nominales completos y adverbios anafóricos a través de varios tipos de texto y categorías gramaticales-semánticas. El segundo corpus, Hlava AD, comprende 512 contextos anotados por cinco anotadores centrados en las relaciones discursivas en construcciones atributivas y no atributivas. Ambos corpus logran un acuerdo interanotador de aproximadamente el 60-65 por ciento. El análisis revela que un menor acuerdo en la coreferencia se correlaciona con el desacuerdo de los modelos automáticos, lo que indica mayor ambigüedad. Los comentarios de los anotadores destacan además los distintos niveles de confianza y las estrategias individuales de lectura.

Presentación de los corpus Hlava Cor y Hlava AD: Variación humana en la coreferencia y las relaciones discursivas

La modelización del mundo autorizada por agentes alinea el entrenamiento con las necesidades de decisión

OscillaTTS: Sesgo inductivo oscilatorio adaptativo para modelar dinámicas prosódicas agudas en TTS basado en difusión

Evaluación de la robustez ante dialectos japoneses en modelos de lenguaje grandes basados en habla y texto

PolicyAlign: Alineación de seguridad basada directamente en políticas para modelos de lenguaje grandes

El preentrenamiento de codificadores de habla mejorados con traducción mejora los LLMs de habla

Diseño de arneses y post-entrenamiento en agentes LLM

La evaluación Reclaim muestra que la memoria con pérdida es peor que no tener memoria

El Espectro de Generalización: Un Enfoque Cromatográfico para Evaluar Algoritmos de Aprendizaje

Explorando representaciones de habla auto-supervisadas en subdialectos del mandarín mediante análisis articulatorio no supervisado

Alineación forzada neuronal completamente diferenciable mediante programación dinámica suave

PEGASUS Ajustado Alcanza Rendimiento de Última Generación en el Corpus XL-Sum Inglés

El marco de red teaming descubre vulnerabilidades de fidelidad en LLMs mediante una arquitectura multi-rol

Calibración y robustez adversaria de la puntuación automática de ASR

STC mejora el servicio al cliente en árabe mediante análisis de sentimiento con MARBERT

Factores conductuales de la incongruencia entre calificación y sentimiento en reseñas turísticas de Sri Lanka

Cliff Tokens: Identificando gatillos de fallo de un solo token en el razonamiento matemático de LLM

El Benchmark SWE-Pro Revela una Brecha Significativa Entre los LLM y la Optimización de Software Experta

Seguridad y privacidad en la generación aumentada por recuperación: arquitecturas, amenazas, defensas y direcciones futuras

BiPACE: Optimización de políticas guiada por bisimulación con estimación de contrafactuales de acción para agentes LLM