O artigo compara duas abordagens metodológicas para selecionar amostras representativas de artigos de notícias sobre desastres: uma abordagem top-down usando inventários de desastres existentes para consultar bancos de dados, e uma abordagem bottom-up usando métodos de PNL para agrupar textos com base em características temporais e espaciais.

  • O estudo utiliza um conjunto de dados de artigos de notícias alemãs sobre deslizamentos de terra em todo o mundo para avaliar esses métodos.
  • Discute as variações na cobertura de eventos resultantes da escolha entre consultar por inventário versus agrupar por características do texto.
  • A decisão de design da pesquisa influencia a amostra de notícias resultante, afetando sua utilidade para estudos sobre desigualdade na cobertura midiática, monitoramento de desastres e enriquecimento de inventários.