تقدم هذه الورقة Svarna، وهي منصة عمل نصوص مجانية ومفتوحة المصدر تعمل عبر الويب ومصممة لسد الفجوات في تكنولوجيا اللغة اليونانية الحديثة من خلال دمج خمسة قواعد بيانات مميزة. تجمع المنصة أكثر من 507 مليون كلمة وحوالي 29 مليون جملة من التسجيلات المؤسسية والأدبية واللهجية ووسائل التواصل الاجتماعي والتاريخية في واجهة واحدة يمكن الوصول إليها دون تسجيل دخول أو تثبيت.
- تدمج خمس قواعد بيانات تغطي تسجيلات مختلفة لتوفير أكثر من 507 مليون كلمة وحوالي 29 مليون جملة.
- تقدم أداة توافق مع وضع علامات KWIC، وتحليل التكرار مع تطبيع حسب التسجيل، واستخراج التلازم باستخدام المعلومات المتبادلة.
- تتضمن قاموسًا لـ 93 علامة خطابية يونانية، وأدوات تحليل على مستوى النص للثنائيات والعناصر المتغيرة، ومقارنة التسجيلات عبر النسبة اللوغاريتمية.
- تتميز بالبحث بالتعبير النمطي وطبقة LLM اختيارية للتوضيح التداولي ووضع البحث الحر.
- مبنية على فهارس النصوص الكاملة SQLite FTS5 مع واجهة خلفية FastAPI، وتم نشرها كحاويات Docker على Azure بموجب ترخيص MIT.
تعمل Svarna كأداة أساسية لاستكشاف البيانات اليونانية المتاحة ومن المتوقع أن تدعم أبحاثًا أكثر شمولاً في المستقبل.