Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 122

sobre la declaración de Dario

Esta publicación de Reddit de la comunidad r/LocalLLaMA discute una declaración realizada por Dario Amodei. El contenido se limita al título y los metadatos, sin texto detallado ni análisis proporcionados en la fuente.

arxiv arXiv cs.AI · hace 8 h

¿Pueden los invariantes agregados acelerar la coincidencia continua de subgrafos? Límites, leyes y un índice espectral dinámico

Este estudio evalúa si el filtrado espectral puede acelerar la coincidencia continua de subgrafos (CSM) en grafos dinámicos, encontrando que, aunque el mantenimiento perezoso es ineficaz, el mantenimiento exacto selectivo ofrece ganancias significativas de rendimiento.

arxiv arXiv cs.AI · hace 8 h

Detección de agentes de codificación de IA en código abierto: un censo validado y multimétodo de 180 millones de repositorios

Un marco de detección multicapa que analiza 180 millones de repositorios Git revela que los métodos de señal única subestiman significativamente la prevalencia de agentes de codificación de IA generativa, omitiendo hasta el 97% de la actividad. El estudio identifica más de 320.000 commits por mes de agentes como Claude Code, que domina la adopción silenciosa a través de archivos de configuración en lugar de cuentas de bot.

arxiv arXiv cs.AI · hace 8 h

Comportamiento de transformación de imágenes en el espacio latente

Este artículo investiga cómo las transformaciones clásicas de imágenes afectan los embeddings en el espacio latente utilizando redes codificadoras de Lunit Inc., Bioptimus y Meta Research Team.

arxiv arXiv cs.AI · hace 8 h

MedPCFM: Mejora de la finalización de nubes de puntos médicos mediante la integración de Transformers de puntos y coincidencia de flujos

Este artículo presenta PCFM, un enfoque de coincidencia de flujos para la finalización de nubes de puntos médicas que integra Point Transformer v3 (PTv3) para abordar la modelación generativa insuficientemente estudiada en este dominio. El método se evalúa en los conjuntos de datos SkullFix, SkullBreak y Mandibular Defect frente a bases fuertes deterministas y de difusión.

arxiv arXiv cs.AI · hace 8 h

ReM-MoA: La memoria de razonamiento sostiene la escalabilidad de Mixture-of-Agents

Los autores proponen ReM-MoA, un marco de trabajo Mixture-of-Agents aumentado con memoria diseñado para sostener las ganancias de rendimiento a medida que aumenta la profundidad del modelo, abordando los problemas de degradación y saturación encontrados en variantes existentes. El sistema utiliza una Memoria de Razonamiento Clasificada y un esquema de Enrutamiento de Memoria Diversa Curada para preservar la diversidad de exploración mientras se propagan trazas de razonamiento de alta calidad a través de las capas.

arxiv arXiv cs.AI · hace 8 h

NoContactNoWorries: Estimación del contacto mediante visión y propiocepción para manipulación diestra en la mano

Los investigadores proponen NoContactNoWorries, un marco basado en transformadores que infiere estados de contacto binarios durante la manipulación en la mano fusionando visión RGB-D con propiocepción del robot. Este enfoque sirve como una señal pseudo-táctil escalable, evitando el costo y la fragilidad asociados con sensores táctiles de hardware dedicados.

arxiv arXiv cs.AI · hace 8 h

Control bayesiano para agentes de codificación

Este artículo presenta un controlador bayesiano para orquestar agentes de codificación modernos, abordando las limitaciones de los sistemas de reglas fijas que ignoran la incertidumbre durante el uso de herramientas.

media r/LocalLLaMA · hace 8 h

¿Qué pasó con Petals (Inferencia descentralizada) de BigScience?

El contenido fuente proporcionado es un enlace de publicación de Reddit y no contiene el texto del artículo ni los detalles de la discusión.

media r/LocalLLaMA · hace 8 h

Un usuario de Reddit sugiere que OpenAI lance GPT-OSS-2 para contrarrestar la IPO de Anthropic

Un usuario de Reddit propone que OpenAI lance un potente modelo de código abierto, denominado GPT-OSS-2, sincronizado con la próxima IPO de Anthropic.

media r/LocalLLaMA · hace 8 h

Qwen3-tts.cpp y GUI de escritorio con Compose Desktop para TTS local

Un desarrollador ha publicado una implementación optimizada en C++ de Qwen3-TTS, alcanzando aproximadamente 5x la velocidad en tiempo real en una RTX 5080, junto con una GUI de escritorio multiplataforma construida con Kotlin Compose Multiplatform. El proyecto ofrece inferencia basada en GGML que soporta ejecución tanto en CPU como en CUDA en Windows y Linux.

arxiv arXiv cs.AI · hace 9 h

El impuesto del lenguaje africano: cuantificar el costo, la latencia y la penalización por contexto de tokenizar lenguas africanas en LLMs de vanguardia

Un estudio cuantifica la penalización estructural de tokenización que enfrentan las lenguas africanas en modelos de lenguaje grandes comerciales, revelando que los hablantes pagan costos más altos y experimentan mayor latencia debido a una asignación ineficiente de subpalabras. Entre 20 lenguas africanas y 11 tokenizadores de vanguardia, cada lengua evaluada incurre en un sobreprecio respecto al inglés, con costos medianos que alcanzan 1.88 veces los del inglés y hasta 8.92 veces para el guion N'Ko.

arxiv arXiv cs.AI · hace 9 h

CompressKV: Compresión de caché KV guiada por recuperación semántica para inferencia eficiente en recursos de LLM de contexto largo

Los autores proponen CompressKV, un marco que comprime las cachés de clave-valor en modelos de lenguaje grandes basados en GQA identificando cabezales de recuperación semántica para retener tokens críticos. Este enfoque aborda la degradación del rendimiento causada por los métodos de desalojo heurísticos existentes que ignoran las funcionalidades distintas de los cabezales de atención.

blog Simon Willison · hace 9 h

Contar el número de pestañas de Safari

Este artículo comparte un método conciso para contar las pestañas abiertas del navegador en Safari usando AppleScript. El comando proporcionado se ejecuta a través de la terminal para obtener el recuento total en todas las ventanas.

media r/LocalLLaMA · hace 9 h

PR de DeepSeek V4 fusionado en llama.cpp

Se ha fusionado una solicitud de extracción que admite a DeepSeek V4 en el repositorio de llama.cpp, permitiendo a los usuarios ejecutar el modelo localmente.

media r/LocalLLaMA · hace 9 h

Componentes propuestos para un kit integral de copia de seguridad de IA local sin conexión

Un usuario de Reddit describe una lista exhaustiva de software y modelos para almacenar sin conexión a internet con el fin de mantener el acceso a las capacidades de IA local en caso de restricciones o prohibiciones generalizadas de internet. El kit propuesto se centra en preservar herramientas esenciales, sistemas operativos y pesos de modelos para garantizar la funcionalidad sin dependencias externas.

media Hugging Face Forums · hace 9 h

Proyecto UCTF: Un programa de investigación abierto sobre representaciones de entrenamiento de IA nativas para máquinas

El Proyecto UCTF ha sido reestructurado desde una única propuesta en un programa de investigación abierto y basado en hipótesis para investigar si las representaciones intermedias nativas para máquinas pueden reducir la redundancia semántica intercultural en el entrenamiento de IA multilingüe.

media Hugging Face Forums · hace 9 h

Error al generar el certificado del curso de RL profundo

Un usuario informa que se encontró con un error al intentar generar un certificado de finalización para el curso de RL profundo en Hugging Face. El problema persiste a pesar de ingresar los detalles requeridos de nombre de usuario y nombre, sin que exista orientación disponible en línea.

lab Hugging Face Blog · hace 9 h

DiScoFormer: Un transformer para densidad y puntuación, a través de distribuciones

El artículo presenta DiScoFormer, un modelo transformer unificado capaz de realizar tanto estimación de densidad como tareas de generación basadas en puntuación a través de varias distribuciones de datos.

lab Google — The Keyword (AI) · hace 9 h

Pregunta a un experto en IA: ¿Qué es exactamente el stack completo?

Un experto de Google explica el concepto de adoptar un enfoque de stack completo para la inteligencia artificial. El artículo destaca que esta metodología integral ha servido como base para el trabajo de IA de Google durante un período prolongado.