يقارن المقال بين نهجين منهجيين لاختيار عينات تمثيلية من مقالات الأخبار حول الكوارث: نهج تنازلي يستخدم قوائم الجرد الحالية للكوارث لاستعلام قواعد البيانات، ونهج تصاعدي يستخدم أساليب معالجة اللغة الطبيعية (NLP) لتجميع النصوص بناءً على السمات الزمنية والمكانية.
- تستخدم الدراسة مجموعة بيانات من المقالات الإخبارية الألمانية المتعلقة بالانهيارات الأرضية في جميع أنحاء العالم لتقييم هذه الأساليب.
- يناقش المقال التباينات في تغطية الأحداث الناتجة عن الاختيار بين الاستعلام بواسطة قائمة الجرد مقابل التجميع بناءً على سمات النص.
- يؤثر قرار تصميم البحث على عينة الأخبار الناتجة، مما يؤثر على فائدتها للدراسات حول عدم المساواة في التغطية الإعلامية، ومراقبة الكوارث، وإثراء قوائم الجرد.