Estrutura de um URL

Um valor válido para o tipo de dados de URL pode ser composto das seguintes partes.

URL de exemplo:

http://www.app.example.co.uk/support

OBSERVAÇÃO: os endereços IP que incluem o identificador de protocolo (http://1.2.3.4) não contêm identificadores de domínio e precisam ser processados usando outro conjunto de métodos. Pode ser mais fácil remover os identificadores de protocolo e alterar o tipo de dados para o endereço IP.

A hierarquia dos nomes de domínio se estende da direita para a esquerda.

Nome do elementoExemplosFunção do WrangleObservações
Domínio de nível superior
  • co.uk
  • com, net, org
Função SUFFIX

Cada URL válido precisa ter pelo menos um domínio de nível superior.

OBSERVAÇÃO: quando a função DOMAIN analisa um domínio de nível superior de várias camadas, como co.uk, a saída é a primeira parte do valor do domínio (por exemplo, co).

Domínio de segundo nível

example

app.example

Função DOMAINEsse valor pode ser extraído de um URL válido usando a função DOMAIN. Consulte a função DOMAIN.
Domínio de terceiro nívelwwwFunção SUBDOMAINEsse valor pode ser extraído de um URL válido usando a função SUBDOMAIN. Consulte a função SUBDOMAIN.
caminho/support
identificador de protocolo

http://

https://

Você pode usar a correspondência de padrões para localizar esses identificadores de protocolo. Em suas transformações em Wrangle, use este padrão do Cloud Dataprep:


`http%?://`

Consulte um exemplo em Função IPTOINT.

hostwww.app.example.comFunção HOSTO identificador de protocolo (por exemplo, http://) não está incluído
Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.