يقارن المقال بين نهجين منهجيين لاختيار عينات تمثيلية من مقالات الأخبار حول الكوارث: نهج تنازلي يستخدم قوائم الجرد الحالية للكوارث لاستعلام قواعد البيانات، ونهج تصاعدي يستخدم أساليب معالجة اللغة الطبيعية (NLP) لتجميع النصوص بناءً على السمات الزمنية والمكانية.

  • تستخدم الدراسة مجموعة بيانات من المقالات الإخبارية الألمانية المتعلقة بالانهيارات الأرضية في جميع أنحاء العالم لتقييم هذه الأساليب.
  • يناقش المقال التباينات في تغطية الأحداث الناتجة عن الاختيار بين الاستعلام بواسطة قائمة الجرد مقابل التجميع بناءً على سمات النص.
  • يؤثر قرار تصميم البحث على عينة الأخبار الناتجة، مما يؤثر على فائدتها للدراسات حول عدم المساواة في التغطية الإعلامية، ومراقبة الكوارث، وإثراء قوائم الجرد.