O artigo compara duas abordagens metodológicas para selecionar amostras representativas de artigos de notícias sobre desastres: uma abordagem top-down usando inventários de desastres existentes para consultar bancos de dados, e uma abordagem bottom-up usando métodos de PNL para agrupar textos com base em características temporais e espaciais.
- O estudo utiliza um conjunto de dados de artigos de notícias alemãs sobre deslizamentos de terra em todo o mundo para avaliar esses métodos.
- Discute as variações na cobertura de eventos resultantes da escolha entre consultar por inventário versus agrupar por características do texto.
- A decisão de design da pesquisa influencia a amostra de notícias resultante, afetando sua utilidade para estudos sobre desigualdade na cobertura midiática, monitoramento de desastres e enriquecimento de inventários.