Todos los artículos
media Interconnects · hace 1 h En vivo

Prohibir la IA de código abierto sería un error

El artículo argumenta que prohibir la IA de código abierto sería un grave error, ya que es segura, protege la seguridad y impulsa la innovación, la educación y la competencia. El código abierto ha impulsado durante mucho tiempo el progreso tecnológico y sirve como un contrapeso vital frente a los modelos de IA monopolísticos, garantizando un acceso más amplio y una innovación democrática sin comprometer la seguridad ni la protección.

media r/LocalLLaMA · hace 1 h En vivo

Observando cómo un asistente de voz local con IA se vuelve menos inteligente

Una prueba en una RTX 5060 Ti mostró que reducir el tamaño del modelo de un asistente de voz local con IA de 9B a 0.8B provoca un descenso pronunciado en la capacidad. El modelo de 9B maneja bien la orquestación de herramientas, mientras que los modelos más pequeños muestran fallos crecientes: el modelo de 4B omite las llamadas a herramientas y adivina hechos, el modelo de 2B sufre deriva semántica, y el modelo de 0.8B falla en operar funciones de agente, activando APIs incorrectas o bucles infinitos.

arxiv arXiv cs.CL · hace 1 h En vivo

Credence: Métricas semánticas y análisis de convergencia para la descomposición de afirmaciones

Credence introduce Semantic-F1, una métrica de similitud cosina BGE-large que mejora la precisión de la descomposición de afirmaciones en 15-32 puntos porcentuales respecto a Jaccard. Establece teoremas de convergencia para la reparación basada en reglas y LLM, mostrando que la reparación basada en reglas es finitamente terminante y monótona, mientras que la reparación basada en LLM requiere guardias de salida anticipada. Las evaluaciones en dominios de redes sociales, enciclopédicos y de noticias muestran EPR de 0.94 a 1.00, con la reparación basada en reglas reduciendo las violaciones de atomicidad entre 47-100% sin pérdida de fidelidad.

media r/LocalLLaMA · hace 2 h

La Universidad Estatal de Ohio lanza el agente de investigación profunda QUEST-35B de código abierto

El equipo de PLN de la Universidad Estatal de Ohio ha lanzado QUEST-35B, un agente de investigación profunda de código abierto entrenado en aproximadamente 32 GPUs H100 utilizando 8.000 muestras sintéticas. El equipo ha liberado como código abierto la receta de entrenamiento, el código, los pesos y los conjuntos de datos, con resultados de evaluación que muestran un rendimiento competitivo en comparación con los principales sistemas de investigación profunda de código cerrado.

media r/LocalLLaMA · hace 2 h

La Universidad Estatal de Ohio lanza el agente de investigación profunda QUEST-35B de código abierto

Los investigadores de la Universidad Estatal de Ohio entrenaron QUEST-35B, un agente de investigación profunda, utilizando aproximadamente 32 GPUs H100 y 8.000 muestras sintéticas. Han liberado como código abierto la receta de entrenamiento, el código, los pesos y los conjuntos de datos, con resultados de evaluación que muestran un rendimiento competitivo en comparación con los principales sistemas de investigación profunda propietarios.