Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 60

Tejido del Pensamiento Formal: Unir la Validación Sintáctica Rigurosa con Representaciones Estructurales Aprendidas

Los autores presentan Weave of Formal Thought (WoFT), un paradigma que combina validación sintáctica rigurosa con representaciones estructurales aprendidas para la generación de código. El enfoque utiliza un motor formal y un decodificador restringido que es correcto y completo respecto a la especificación completa de Tree-sitter. Al augmentar el análisis LR generalizado con lexificación especulativa, el sistema mantiene hipótesis concurrentes del estado del lexer para admitir prefijos válidos de programas mientras rechaza los inválidos. Además, WoFT emplea ajuste fino de variables latentes para entrenar modelos a intercalar símbolos de gramática no terminal directamente en el proceso de generación. Este método utiliza el algoritmo wake-sleep reponderado para optimizar el límite inferior de evidencia ponderado por importancia del texto superficial. El modelo aprende a retener selectivamente derivaciones formales como una pizarra estructural adaptativa durante la inferencia. Los experimentos en Python muestran que el ajuste fino de StarCoder2-3B con este objetivo reduce la entropía cruzada por token en un 14.3% en comparación con una línea base solo de texto.

Tejido del Pensamiento Formal: Unir la Validación Sintáctica Rigurosa con Representaciones Estructurales Aprendidas

SpeechEQ: Evaluación de la inteligencia emocional en modelos conversacionales de voz conscientes del contexto social

Autodata: Un científico de datos agente para crear datos sintéticos de alta calidad

Dziri Voicebot: Sistema de voz a voz de extremo a extremo para el dialecto argelino

Tatoxa: Un sistema novel de desintoxicación de texto para el tártaro de bajos recursos

Colapso del RL de Uso de Herramientas en Múltiples Pasos y Correcciones Supervisadas

Detectar, Desaprender, Restaurar: Defender Modelos de Resumen de Texto Contra el Envenenamiento de Datos

Un estudio revela que los lectores prefieren las traducciones literarias humanas sobre las de IA, a pesar de la calidad adecuada de la máquina

Evaluación de la Robustez del Razonamiento OCR en Modelos Visión-Lenguaje Bajo Perturbaciones Visuales

Des-aprendizaje natural: Control asimétrico de qué reglas sobreviven al preentrenamiento

La ceguera del léxico de palabras clave distorsiona la medición de la postura retórica

Auditoría de la sensibilidad al orden en modelos de lenguaje grande multimodales

La IA de voz en tiempo real oye pero no escucha

Pipeline local de NL a SQL usando Qwen3 4B y planificación determinista

Cotización bloqueada de Dell para 6x RTX PRO 6000 Max-Q a $8,960

Consulta en Reddit sobre ejecutar modelos grandes con 4x-8x RTX 6000 PRO

Estructuración de un diccionario legible por máquina árabe-inglés usando gramáticas de expresión de análisis

WBCMor VQA: Un punto de referencia bilingüe inglés-urdu para la respuesta a preguntas visuales en hematología

Generación automática de resúmenes para artículos académicos mediante aprendizaje basado en prompts

Medir la dificultad de la investigación en PLN: Una relación con forma de U invertida con el impacto académico