BITEMBED: Marco de trabajo de bits extremadamente bajos para incrustaciones de texto basadas en LLM

El artículo presenta BITEMBED, un marco de trabajo de bits extremadamente bajos diseñado para abordar los altos costos de implementación de incrustadores de texto basados en LLM, enfocándose tanto en la eficiencia de codificación como en el almacenamiento de vectores. El método convierte las arquitecturas base de LLM preentrenadas en codificadores al estilo BitNet que cuentan con pesos ternarios, activaciones cuantizadas y refinamiento ligero de normalización. Para adaptar estos modelos al aprendizaje de representaciones, BITEMBED emplea un preentrenamiento contrastivo continuo seguido de un ajuste fino supervisado contrastivo. Este proceso de ajuste fino utiliza la destilación de distribución de similitud y la destilación de relación de atención desde un modelo maestro de precisión completa. Más allá de la cuantización de la arquitectura base, el marco de trabajo entrena las incrustaciones de salida para admitir múltiples precisiones de almacenamiento, permitiendo compensaciones flexibles entre rendimiento y costos de almacenamiento. Los experimentos en la benchmark MMTEB utilizando Qwen3-0.6B y Gemma3-270M demuestran que BITEMBED tiene un rendimiento mayormente comparable al de los incrustadores maestros de precisión completa.