arxiv arXiv cs.LG · hace 2 h · fuente: hace 10 d · research

Los núcleos de GPU generados por LLM enfrentan la ilusión de la corrección

Traducido del English → Español

Las pruebas de referencia que utilizan comprobaciones de forma fija pasan por alto errores reales en los núcleos de GPU generados por LLM. Un corpus controlado de 24 núcleos, que incluye 9 variantes con errores de transcripción, revela que un oráculo consciente del esquema de operaciones detecta todos los fallos y pasa todos los controles correctos, con resultados idénticos en cinco arquitecturas de GPU.

Importancia 3/3 Nuevo entorno de evaluación con diferenciadores arXiv cs.LG NVIDIA Mistral AI OpenAI Code generation Evaluation & benchmarks Reasoning models

Leer original