Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 59

Consulta en Reddit sobre ejecutar modelos grandes con 4x-8x RTX 6000 PRO

Un usuario de Reddit busca opiniones de la comunidad sobre el rendimiento de modelos de lenguaje grandes en sistemas equipados con cuatro a ocho GPUs NVIDIA RTX 6000 PRO. La consulta se dirige específicamente a usuarios que tienen entre 384GB y 768GB de VRAM disponibles para ejecutar modelos como GLM 5.2, Kimi 2.7 y DeepSeek V4 Pro. El autor señala que, aunque estos modelos pueden ejecutarse técnicamente con cuantización de 4 bits, es posible que no quepan dentro de las limitaciones de memoria al usar precisión de 8 bits. Hace referencia a un repositorio de benchmarks pero destaca que carece de datos para los lanzamientos más recientes de modelos. Una preocupación clave planteada es si la degradación del rendimiento al usar cuantización de 4 bits frente a 8 bits es lo suficientemente significativa como para afectar tareas agénticas o de programación. El usuario también pregunta qué backends de inferencia, como vLLM o SGLang, están siendo utilizados actualmente por otros en esta configuración de hardware.

arxiv arXiv cs.CL · hace 2 h

Estructuración de un diccionario legible por máquina árabe-inglés usando gramáticas de expresión de análisis

Este artículo presenta un método para estructurar una versión legible por máquina del diccionario árabe-inglés Al-Mawrid, abordando la falta de estandarización en los formatos impresos. El enfoque convierte flujos no estructurados de palabras y puntuación en estructuras jerárquicas explícitas que definen componentes de entrada como subentradas, etiquetas de dominio y equivalencias de traducción. El análisis (parsing) sirve como paso central dentro de un diseño en cascada, implementado utilizando el formalismo de gramáticas de expresión de análisis. Esta técnica permite la organización automática o semiautomática de las entradas del diccionario a pesar de la ausencia de estandarización de la microestructura en los diccionarios árabes. El estudio demuestra que inducir la microestructura permite una precisión plausible al estructurar estos recursos léxicos complejos. Al transformar texto sin formato en formatos definidos, el trabajo respalda aplicaciones posteriores de procesamiento del lenguaje natural que requieren datos léxicos legibles por máquina.

arxiv arXiv cs.CL · hace 2 h

WBCMor VQA: Un punto de referencia bilingüe inglés-urdu para la respuesta a preguntas visuales en hematología

Los investigadores han presentado WBCMor VQA, un punto de referencia bilingüe clínicamente validado para el análisis de leucemia y glóbulos blancos normales en inglés y urdu. Este recurso aborda la brecha en las tecnologías de atención médica multilingües, particularmente en regiones como Pakistán, donde la documentación clínica a menudo no coincide con los idiomas de comunicación de los pacientes. El conjunto de datos comprende 110.000 pares de preguntas y respuestas bilingües anotados en 20.000 imágenes de células individuales de glóbulos blancos leucémicos y normales. Para garantizar la consistencia lingüística y la corrección clínica, el punto de referencia utiliza anotaciones conscientes de la morfología de los conjuntos de datos LeukemiaAttri y WBCAtt junto con un diccionario de hematología en urdu específico del dominio. El estudio también destaca las limitaciones de los recursos existentes de visión e idioma centrados en el inglés en entornos diversos de atención médica. Se establecieron métricas de rendimiento de referencia evaluando múltiples Modelos de Lenguaje Visión de código abierto en este nuevo punto de referencia. Este recurso tiene como objetivo facilitar el desarrollo de sistemas de IA accesibles para contextos médicos multilingües.

arxiv arXiv cs.CL · hace 2 h

Generación automática de resúmenes para artículos académicos mediante aprendizaje basado en prompts

Este estudio investiga el aprendizaje basado en prompts para la generación automática de resúmenes de artículos académicos con el fin de abordar la falta de datos de entrenamiento etiquetados en los métodos supervisados existentes. Los investigadores diseñaron plantillas de prompts específicas para la tarea combinadas con los resúmenes de los artículos como entradas para varios modelos de lenguaje, incluyendo GPT-2 y T5 desplegados localmente, así como ChatGPT accesible a través de API. Los experimentos realizados en tres conjuntos de datos demostraron que ChatGPT con plantillas de prompts logró un rendimiento comparable a métodos supervisados anteriores sin requerir muestras de entrenamiento específicas para la tarea. Cuando se añadieron un pequeño número de ejemplos a los prompts, el modelo superó significativamente a los métodos más avanzados en dos de los conjuntos de datos. El análisis reveló que, aunque ChatGPT posee fuertes capacidades de modelado de lenguaje, su rendimiento es altamente sensible a la información específica proporcionada dentro del prompt. Los estudios de caso indicaron que los resúmenes generados son generalmente coherentes, informativos y se asemejan estrechamente a los escritos por los autores. Este enfoque no depende de corpus de entrenamiento específicos del dominio, apoyando la minería de texto posterior y la investigación bibliométrica para artículos que carecen de resúmenes existentes.

arxiv arXiv cs.CL · hace 2 h

Medir la dificultad de la investigación en PLN: Una relación con forma de U invertida con el impacto académico

Este estudio propone un sistema de evaluación integral para medir la dificultad de la investigación académica, centrado en el Procesamiento del Lenguaje Natural como caso de estudio. Los autores extraen características internas y externas de los artículos, incluyendo colaboración, contenido y referencias, para calcular múltiples indicadores de dificultad. Estos indicadores se ponderan utilizando el método de peso de entropía y se suman para generar una puntuación final de dificultad de la investigación. El impacto académico se cuantifica mediante la frecuencia de citas, mientras que las evaluaciones de expertos validan la fiabilidad del enfoque de medición. Los resultados empíricos indican que el número de páginas, el número de referencias y la participación institucional de alto nivel se correlacionan significativamente con el impacto académico. Crucialmente, el análisis revela una relación con forma de U invertida entre la dificultad de la investigación y el impacto. Esto sugiere que la investigación moderadamente difícil tiende a lograr el mayor nivel de influencia académica.

Consulta en Reddit sobre ejecutar modelos grandes con 4x-8x RTX 6000 PRO

Estructuración de un diccionario legible por máquina árabe-inglés usando gramáticas de expresión de análisis

WBCMor VQA: Un punto de referencia bilingüe inglés-urdu para la respuesta a preguntas visuales en hematología

Generación automática de resúmenes para artículos académicos mediante aprendizaje basado en prompts

Medir la dificultad de la investigación en PLN: Una relación con forma de U invertida con el impacto académico

iLLaDA: Un modelo de lenguaje de difusión enmascarado de 8B con atención totalmente bidireccional

Hybrid-IR: Recuperación híbrida de doble vía con razonamiento iterativo para la respuesta a preguntas médicas complejas

Enrutamiento de Rama Local: Escalado Eficiente y Entrenable en Tiempo de Prueba para Modelos de Lenguaje

La memoria marca la diferencia: evaluando cómo distintos roles de memoria moldean agentes conversacionales

Traducción automática neuronal para Tangkhul-Inglés de recursos limitados

Sarashina2.2-TTS: Abordando la polifonía de kanji en la generación de voz japonesa mediante escalado de datos y síntesis dirigida

Estilometría computacional de traducciones al inglés del Canon Pali a través de los Pitakas

Operadores de historia: Descomponer la transformación de original a secuela en el espacio de incrustaciones

SFL-MTSC: Aprovechando la autoconsistencia multi-tarea a nivel de fotogramas semánticos para una comprensión robusta del lenguaje hablado con múltiples intenciones

Encuesta de estrategias de detección y mitigación de toxicidad para modelos de lenguaje multilingües

Presentación de los corpus Hlava Cor y Hlava AD: Variación humana en la coreferencia y las relaciones discursivas

La modelización del mundo autorizada por agentes alinea el entrenamiento con las necesidades de decisión

OscillaTTS: Sesgo inductivo oscilatorio adaptativo para modelar dinámicas prosódicas agudas en TTS basado en difusión

Evaluación de la robustez ante dialectos japoneses en modelos de lenguaje grandes basados en habla y texto

PolicyAlign: Alineación de seguridad basada directamente en políticas para modelos de lenguaje grandes