Caracteres especiais de expressão regular compatíveis

O Cloud Dataprep é compatível com um conjunto de caracteres especiais para expressões regulares que são comuns a todos os mecanismos de execução aceitos pela plataforma.

Em expressões regulares, a barra invertida é o caractere de escape. Ela pode ser usada para denotar um caractere em escape, uma string, uma literal ou um dos conjuntos de caracteres especiais compatíveis.

Caracteres especiais RegEx compatíveis

A tabela abaixo identifica os caracteres especiais compatíveis com a plataforma.

Caracteres especiaisDescrição
\\Correspondência de literal de string para o caractere \.

\b

Corresponde a qualquer limite de palavra de largura zero, como entre uma letra e um espaço.

Exemplo: /\bre/ não corresponde a re em tire, já que re não está no limite de palavra. /re\b/ corresponde.

\B

Corresponde a qualquer limite que não seja de palavra de largura zero, como entre duas letras e dois espaços.

Exemplo: /\Bre/ corresponde a re em tire. Não corresponde em respect, já que essa instância de re está em um limite de palavras.

\cX Combina um caractere de controle (CTRL + A-Z), em que X é a letra correspondente no alfabeto.
\dCorresponde a qualquer dígito.
\DCorresponde a qualquer não dígito.
\fCorresponde a um avanço de formulário.
\n

Corresponde a um avanço de linha.

OBSERVAÇÃO: estes caracteres não são compatíveis com entradas para tipos de dados Object e Array.

\rCorresponde a um retorno de carro.
\s

Corresponde a qualquer caractere de espaço em branco. Esses caracteres incluem:

  • espaço
  • tabulação
  • avanço de formulário
  • avanço de linha
  • outros caracteres de espaço do Unicode
\SCorresponde a qualquer caractere que não seja um dos caracteres de espaço em branco compatíveis.
\t

Corresponde a uma tabulação horizontal.

OBSERVAÇÃO: estes caracteres não são compatíveis com entradas para tipos de dados Object e Array.

\v

Corresponde a uma tabulação vertical.

\w

Corresponde a qualquer valor alfanumérico, incluindo o sublinhado.

Dica: os nomes das colunas precisam corresponder ao mesmo conjunto de caracteres.

\WCorresponde a qualquer caractere não alfanumérico, incluindo o sublinhado.
\xHH Corresponde ao código de caractere ASCII conforme expresso pelo valor hexadecimal HH.
\uHHHHCorresponde ao código de caractere Unicode conforme expresso pelo valor hexadecimal HHHH.

Caracteres em escape exigidos

Os seguintes caracteres têm um significado especial dentro de uma expressão regular.

. ^ $ * + - ? ( ) [ ] { } \ | — /

Para fazer referência ao caractere de literal, você precisa colocá-lo em escape dentro da expressão regular, conforme o exemplo:

/\./
Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.