EXEMPLO: funções SUMIF e COUNTDISTINCTIF

Neste exemplo, ilustramos como você pode usar as seguintes funções condicionais de cálculo para analisar os dados de votação:

  • SUMIF: soma de um conjunto de valores por grupo que atende a uma condição especificada. Consulte a função SUMIF.
  • COUNTDISTINCTIF: soma de um conjunto de valores por grupo que atende a uma condição especificada. Consulte a função COUNTDISTINCTIF.

Fonte:

Veja a seguir alguns exemplos de dados de votação em 16 distritos de 8 cidades em 4 condados, em que os registros foram invalidados na mesa de votação, impedindo os eleitores de votar. Os distritos em que esse problema ocorreu já tinham sido adicionados a uma lista de observação (precinctWatchList).

totalReginvalidRegprecinctWatchListprecinctIdcityIdcountyId
73124s111
74329s211
8740 321
9830 421
62229 532
6930 632
77537s742
102549s842
78713 953
3420 1053
34239s1163
38728s1263
58259 1374
2440 1474
9406s1584
9014s1684

Transformação:

Primeiro, some os registros inválidos (invalidReg) por cidade:

derive type:single value:SUMIF(invalidReg, precinctWatchList == "y") group:cityId as:'invalidRegbyCityId'

A coluna invalidRegbyCityId contém registros inválidos em toda a cidade. Em relação aos condados, agora você precisa identificar o número de distritos que estavam na lista de observação e faziam parte de um problema de registro que envolvia toda a cidade. Esta etapa executa uma agregação:

pivot value:COUNTDISTINCTIF(precinctId, invalidRegbyCityId > 60) group:countyId limit:1

Resultados:

countyIdcountdistinctif_precinctId
10
22
32
40

Quem trabalha na votação dos condados 2 e 3 precisa investigar os problemas de registro nos distritos.

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.