BamiBERT: वियतनामी के लिए एक नया BERT-आधारित भाषा मॉडल
शोधकर्ताओं ने BamiBERT का परिचय दिया, जो वियतनामी के लिए एक नया BERT-आधारित प्री-ट्रेन्ड भाषा मॉडल है, जो वर्तमान मानक PhoBERT की सीमाओं को दूर करने के लिए डिज़ाइन किया गया है। 129GB कॉरपस पर 20 epochs के लिए शून्य से प्रशिक्षित, यह 2048 टोकन तक विस्तारित संदर्भ लंबाई का समर्थन करता है और बाहरी शब्द विभाजन के बिना सीधे कच्चे इनपुट पर काम करता है।