Propuesta de LLMs destilados de código abierto y crowdsourced mediante entrenamiento distribuido

Un usuario de Reddit propone un sistema para crear modelos de lenguaje grandes (LLMs) destilados verdaderamente de código abierto, envolviendo servicios de IA existentes por línea de comandos. Este enfoque recopilaría entradas y salidas de usuarios desde aplicaciones como asistentes de codificación o chatbots para construir conjuntos de datos masivos mediante la participación voluntaria.

La propuesta sugiere distribuir la fase de entrenamiento del modelo entre las GPUs de los jugadores, permitiendo un cálculo más lento pero escalable. Reconoce que establecer una autoridad central confiable para la coordinación y la liberación de datos es el principal desafío, aunque comenzar con modelos más pequeños podría ayudar a construir confianza con el tiempo.

El autor señala que, si bien el concepto requiere infraestructura y coordinación significativas, ofrece una vía potencial para el desarrollo de modelos impulsado por la comunidad si se pueden movilizar suficientes voluntarios.