BamiBERT: نموذج لغوي جديد قائم على BERT للغة الفيتنامية
يقدم الباحثون BamiBERT، وهو نموذج لغوي مُدرَّب مسبقًا جديد قائم على BERT للغة الفيتنامية مصمم لمعالجة قيود المعيار الحالي، PhoBERT. تم تدريبه من الصفر على مجموعة بيانات بحجم 129 جيجابايت لمدة 20 عصرًا، ويدعم طول سياق موسع يصل إلى 2048 رمزًا ويعمل مباشرةً على الإدخال الخام دون تقسيم كلمات خارجي.