Função KTHLARGEST

A função extrai o valor classificado dos valores em uma coluna, em que k=1 retorna o valor máximo. O valor de k precisa estar entre 1 e 1.000, inclusive.

Para realizar esse cálculo, duas instâncias do mesmo valor são tratadas como valores separados. Então, se o conjunto de dados contiver três linhas com valores de coluna 10, 9 e 9, KTHLARGEST retornará 9 para k=2 e k=3.

Quando usada em uma transformação pivot, a função é calculada para cada instância do valor especificado no parâmetro group. Consulte Transformação Pivot.

A coluna de entrada pode ser de tipo Inteiro ou Decimal. Os dados não numéricos na coluna são ignorados. Se uma linha contiver um valor ausente ou nulo, ele não será considerado no cálculo.

Uso básico

pivot value:KTHLARGEST(myRating, 2) group:postal_code limit:1

Resultado: gera uma tabela de duas colunas que contém os valores únicos na coluna postal_code e o segundo valor mais alto da coluna myRating para o valor postal_code. O parâmetro limit define o número máximo de colunas do resultado.

Sintaxe

pivot value:KTHLARGEST(function_col_ref, k_integer) [ group:group_col_ref] [limit:limit_count]

ArgumentoObrigatório?Tipo de dadosDescrição
function_col_refSstringNome da coluna à qual aplicar a função
k_integerSinteiro (positivo)A classificação do valor a extrair da coluna de origem

Para mais informações sobre os parâmetros group e limit, consulte Transformação Pivot.

Para mais informações sobre os padrões de sintaxe, consulte Notas de sintaxe da documentação da linguagem.

function_col_ref

Nome da coluna que contém os valores com base nos quais você quer calcular a média. A coluna precisa conter valores inteiros ou decimais.

  • Valores literais não são aceitos como entradas.
  • Não há compatibilidade com várias colunas e caracteres curinga.

Observações sobre o uso:

Obrigatório?Tipo de dadosValor de exemplo
SimString (referência de coluna)myValues

k_integer

Inteiro que representa a classificação do valor a extrair da coluna de origem.

OBSERVAÇÃO: o valor para k precisa ser um número inteiro entre 1 e 1.000, inclusive.

  • k=1 representa o valor máximo na coluna.
  • Se k é maior ou igual ao número de valores na coluna, o valor mínimo é retornado.
  • Os valores ausentes e nulos não são considerados na classificação de k.

Notas de uso:

Obrigatório?Tipo de dadosValor de exemplo
SimInteiro (positivo)4

Exemplos

Este exemplo explora como você pode usar funções de agregação para calcular a classificação de valores em uma coluna usando as funções KTHLARGEST e KTHLARGESTUNIQUE.

Fonte:

Você tem um conjunto de pontuações de testes de estudantes:

EstudanteScore
Anna84
Ben71
Caleb76
Danielle87
Evan85
Faith92
Gabe87
Hannah99
Ian73
Jane68

Transformação:

Você pode usar as seguintes transformações para extrair as pontuações da 1ª à 4ª colocação no teste:

derive type:single value:KTHLARGEST(Score, 1) as: '1st'

derive type:single value:KTHLARGEST(Score, 2) as: '2nd'

derive type:single value:KTHLARGEST(Score, 3) as: '3rd'

derive type:single value:KTHLARGEST(Score, 4) as: '4th'

derive type:single value:KTHLARGESTUNIQUE(Score, 3) as: '3rdUnique'

derive type:single value:KTHLARGESTUNIQUE(Score, 4) as: '4thUnique'

Resultados:

Quando você reorganiza as colunas, o conjunto de dados pode ser o seguinte:

EstudantePontuação3º Exclusivo4º Exclusivo
Anna84999287878785
Ben71999287878785
Caleb76999287878785
Danielle87999287878785
Evan85999287878785
Faith92999287878785
Gabe87999287878785
Hannah99999287878785
Ian73999287878785
Jane68999287878785

Observações:

  • O valor 87 é equivalente à terceira e à quarta pontuação.
    • Para a função KTHLARGEST, é o resultado da terceira e da quarta classificação.
    • Para a função KTHLARGESTUNIQUE, é o resultado apenas da terceira classificação.

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.