أبلغ مستخدم عن خطأ حرج في مكتبة text-embeddings-inference الخاصة بـ Hugging Face يؤثر على نماذج Qwen3 وGemma3. تنشأ المشكلة عند تشغيل الاستدلال على وحدات المعالجة المركزية مع طلبات متزامنة، مما يؤدي إلى تدهور كبير في الدقة. بشكل محدد، يتخطى الخلفية Candle أقنعة الانتباه بشكل غير صحيح للحزم حيث يكون لجميع تسلسلات الإدخال نفس الطول. يقوض هذا العيب موثوقية التضمينات المُولدة تحت هذه الظروف المحددة. لمعالجة المشكلة، قدم المؤلف طلب سحب يحتوي على إصلاح تم اختباره بدقة على أجهزته المحلية. يسلط هذا الخطر الضوء على مخاطر الاستقرار المحتملة في خدمات التضمين القائمة على وحدة المعالجة المركزية التي تتعامل مع مدخلات مجمعة.