Adicionar dados de pesquisa

Integre dados de outras fontes ao conjunto de dados atual. Com base em uma coluna de chaves identificada no conjunto de dados de pesquisa, insira os valores correspondentes em outras colunas do conjunto de dados de pesquisa como novas colunas no conjunto de origem.

Dica: as pesquisas de coluna são úteis para adicionar dados de referência com base nos valores de uma coluna.

Por exemplo, os dados contêm as abreviações de duas letras dos estados dos EUA, e o sistema de destino está esperando o nome completo de cada estado. Você precisa substituir a abreviação do estado XY pelo nome completo de cada estado em cada linha.

Configurar os dados de pesquisa

A tabela de dados precisa ser como a seguinte:

State-2LetterEstado
ALAlabama
AKAlasca
AZArizona
ARArkansas
CACalifórnia
COColorado
CTConnecticut
DEDelaware
DCDistrito de Columbia
FLFlórida
GAGeórgia
HIHavaí
IDIdaho
ILIllinois
INIndiana
IAIowa
KSKansas
KYKentucky
LALouisiana
MEMaine
MDMaryland
MAMassachusetts
MIMichigan
MNMinnesota
MSMississippi
MOMissouri
MTMontana
NENebraska
NVNevada
NHNew Hampshire
NJNova Jersey
NMNovo México
NYNova York
NCCarolina do Norte
NDDakota do Norte
OHOhio
OKOklahoma
OROregon
PAPensilvânia
RIRhode Island
SCCarolina do Sul
SDDakota do Sul
TNTennessee
TXTexas
UTUtah
VTVermont
VAVirgínia
WAWashington
WVVirginia Ocidental
WIWisconsin
WYWyoming

Esta tabela de dados precisa ser enviada como um novo conjunto de dados. Consulte a página "Importar dados".

Realizar a pesquisa

Etapas:

  1. Na página "Transformer", clique na lista suspensa na coluna que contém as abreviações de estado de duas letras. Selecione Pesquisa....
  2. No assistente de pesquisa, selecione o conjunto de dados a ser usado para a pesquisa.
  3. Para a chave de pesquisa, selecione a coluna no conjunto de dados a ser usada como o valor da chave. No exemplo acima, ela é State_2Letter.
  4. Clique em Execute Lookup.
  5. O valor da chave de pesquisa é usado para localizar todos os outros valores de coluna no conjunto de dados de referência. Esses valores são inseridos em colunas separadas logo à direita da coluna de origem.
  6. Convém descartar algumas das colunas importadas. No caso acima, opte por excluir a coluna identificadora de estado de duas letras, que foi substituída pela coluna de nome de estado completo.

Consulte Assistente de pesquisa.

Exemplo: pesquisa de fusos horários

O CSV vinculado acima também contém informações de fuso horário de cada estado, que você usa para fornecer informações de maior fidelidade em carimbos de data/hora.

Os fuso horários dos EUA não são demarcados consistentemente por linhas de estado. Alguns estados estão divididos em vários fusos horários. Para uma representação mais precisa de fusos horários, você precisa fazer o download e usar um banco de dados de CEPs, muitos dos quais estão disponíveis gratuitamente on-line. Esse CSV é fornecido apenas para fins de teste.

Neste caso, você está trabalhando com um conjunto de dados que contém carimbos de data/hora, armazenados em fusos horários diferentes com base no local onde ocorreu um evento ou uma transação. No entanto, os carimbos de data/hora não contêm informações de fuso horário.

Você pode usar uma fonte externa de informações de fuso horário para inserir fusos horários no conjunto de dados. No exemplo a seguir, os fusos horários são derivados com base em abreviações de duas letras para o estado dos EUA. Uma representação mais precisa seria baseada em dados de CEP.

Etapas:

  1. Conclua as etapas de 1 a 5 na seção anterior.
  2. Exclua todas as colunas, exceto aquelas que contêm informações de fuso horário. A coluna Time Offsets identifica o fuso horário predominante em cada estado como uma diferença do fuso horário UTC (Tempo médio de Greenwich).
  3. Mova essa coluna à direita da coluna que contém os carimbos de data/hora.

OBSERVAÇÃO: dependendo dos requisitos do sistema de destino, use a transformação split para detalhar os dados da coluna de maneira que apenas a diferença numérica (por exemplo, -6:00) esteja presente. Então, você pode usar a função DATEDIF para aplicar a diferença de fuso horário aos carimbos de data/hora. Dessa maneira, é possível converter carimbos de data/hora no fuso horário de origem antes que eles sejam consumidos pelo sistema de destino.

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.