本記事は、災害に関するニュース記事の代表標本を選択するための2つの方法論的アプローチを比較している。1つは既存の災害目録を用いてデータベースを検索するトップダウン型アプローチであり、もう1つは時間的・空間的特徴に基づいてテキストをクラスタリングするNLP手法を用いるボトムアップ型アプローチである。
- 本研究では、世界中の土砂災害に関するドイツ語ニュース記事のデータセットを用いて、これらの手法を評価している。
- 目録による検索とテキスト特徴によるクラスタリングの選択によって生じるイベント報道のばらつきについて論じている。
- 研究設計の決定は結果として得られるニュース標本に影響を与え、それはメディア報道の不平等、災害監視、目録の充実に関する研究におけるその有用性に影響を与える。