Guia de conversão de SQL do Teradata
Este documento detalha as semelhanças e diferenças de sintaxe SQL entre o Teradata e o BigQuery para ajudar você a planejar sua migração. Use a tradução SQL em lote para migrar os scripts SQL em massa ou a tradução de SQL interativo para traduzir consultas ad-hoc.
Tipos de dados
Esta seção mostra os equivalentes entre os tipos de dados no Teradata e no BigQuery.
Teradata | BigQuery | Observações |
---|---|---|
INTEGER |
INT64 |
|
SMALLINT |
INT64 |
|
BYTEINT |
INT64 |
|
BIGINT |
INT64 |
|
DECIMAL |
Use o Use os tipos de dados decimais parametrizados do BigQuery se precisar impor limites de dígitos personalizados ou de escala (restrições). O Teradata permite inserir valores de maior precisão ao arredondar o valor armazenado. No entanto, os cálculos continuam altamente precisos. Isso pode levar a um comportamento de arredondamento inesperado em comparação com o padrão ANSI. |
|
FLOAT |
FLOAT64 |
|
NUMERIC |
Use o Use os tipos de dados decimais parametrizados do BigQuery se precisar impor limites de dígitos personalizados ou de escala (restrições). O Teradata permite inserir valores de maior precisão ao arredondar o valor armazenado. No entanto, os cálculos continuam altamente precisos. Isso pode levar a um comportamento de arredondamento inesperado em comparação com o padrão ANSI. |
|
NUMBER |
Use o Use os tipos de dados decimais parametrizados do BigQuery se precisar impor limites de dígitos personalizados ou de escala (restrições). O Teradata permite inserir valores de maior precisão ao arredondar o valor armazenado. No entanto, os cálculos continuam altamente precisos. Isso pode levar a um comportamento de arredondamento inesperado em comparação com o padrão ANSI. |
|
REAL |
FLOAT64 |
|
CHAR/CHARACTER |
STRING |
Use os tipos de dado |
VARCHAR |
STRING |
Use os tipos de dado |
CLOB |
STRING |
|
JSON |
JSON |
|
BLOB |
BYTES |
|
BYTE |
BYTES |
|
VARBYTE |
BYTES |
|
DATE |
DATE |
O BigQuery não oferece suporte à formatação personalizada semelhante ao suporte que o Teradata oferece com DataForm no SDF. |
TIME |
TIME |
|
TIME WITH TIME ZONE |
TIME |
O Teradata armazena o tipo de dados TIME no UTC e permite que você
passe um deslocamento do UTC usando a sintaxe WITH TIME ZONE .
O tipo de dados TIME no BigQuery
representa um horário independente de qualquer data ou fuso horário. |
TIMESTAMP |
TIMESTAMP |
Os tipos de dados TIMESTAMP
do Teradata e do BigQuery
têm precisão de microssegundos. No entanto, o Teradata é compatível com segundos intercalares, mas
o BigQuery não.Os tipos de dados do Teradata e do BigQuery geralmente são associados a um fuso horário UTC. Veja os detalhes aqui. |
TIMESTAMP WITH TIME ZONE |
TIMESTAMP |
O TIMESTAMP do Teradata pode ser definido como um fuso horário diferente
para todo o sistema, por usuário ou coluna (usando
WITH TIME ZONE ).O tipo TIMESTAMP do BigQuery define UTC como padrão se você
não especifica explicitamente um fuso horário. Verifique se você exportou informações de fuso horário
corretamente para que
o BigQuery possa convertê-las na importação.
Não concatene um valor DATE e TIME sem informações de fuso horário. Verifique se você
converteu as informações de fuso horário em UTC antes da exportação.O BigQuery tem DATETIME para uma abstração
dentro da hora legal, que não mostra um fuso horário quando ele é gerado, e
TIMESTAMP , que é um ponto preciso no tempo que sempre mostra
o fuso horário UTC. |
ARRAY |
ARRAY |
|
MULTI-DIMENSIONAL ARRAY |
ARRAY |
No BigQuery, use uma matriz de structs. Cada struct
contém um campo do tipo ARRAY . Para detalhes, consulte a
documentação do BigQuery. |
INTERVAL HOUR |
INT64 |
|
INTERVAL MINUTE |
INT64 |
|
INTERVAL SECOND |
INT64 |
|
INTERVAL DAY |
INT64 |
|
INTERVAL MONTH |
INT64 |
|
INTERVAL YEAR |
INT64 |
|
PERIOD(DATE) |
DATE ,
DATE |
PERIOD(DATE) precisa ser convertido em duas colunas DATE
contendo a data de início e a data de término para que elas possam ser usadas
com funções de janela. |
PERIOD(TIMESTAMP WITH TIME ZONE) |
TIMESTAMP ,
TIMESTAMP |
|
PERIOD(TIMESTAMP) |
TIMESTAMP ,
TIMESTAMP |
|
PERIOD(TIME) |
TIME ,
TIME |
|
PERIOD(TIME WITH TIME ZONE) |
TIME ,
TIME |
|
UDT |
STRING |
|
XML |
STRING |
|
TD_ANYTYPE |
STRING |
Para mais informações sobre a transmissão de tipos, consulte a próxima seção.
Formatação de tipo do Teradata
O Teradata SQL usa um conjunto de formatos padrão para exibir expressões e
dados de coluna e para conversões entre tipos de dados. Por exemplo, um
tipo de dados PERIOD(DATE)
no modo INTEGERDATE
é formatado como YY/MM/DD
por padrão. Sugerimos usar o modo ANSIDATE sempre que possível para garantir
a conformidade com o SQL ANSI e usar essa chance para limpar os formatos legados.
O Teradata permite a aplicação automática de formatos personalizados usando a
cláusula FORMAT
,
sem alterar o armazenamento subjacente, como um atributo de tipo de dados
quando você cria uma tabela usando DDL ou em uma expressão derivada. Por
exemplo, uma especificação FORMAT
9.99
arredonda qualquer valor FLOAT
para dois dígitos.
No BigQuery, essa funcionalidade precisa ser convertida usando a
função ROUND()
.
Essa funcionalidade requer o tratamento de casos extremos complexos. Por exemplo,
quando a cláusula FORMAT
é aplicada a uma coluna NUMERIC
, é preciso considerar as
regras especiais de arredondamento e formatação da conta (em inglês).
Uma cláusula FORMAT
pode ser usada para converter implicitamente um valor de época INTEGER
para um formato DATE
. Ou uma especificação FORMAT
X(6)
em uma coluna VARCHAR
truncará o valor da coluna e, portanto, você precisará convertê-lo em uma função SUBSTR()
. Esse comportamento não é compatível com ANSI SQL. Portanto, sugerimos não
migrar formatos de coluna para o BigQuery.
Se os formatos de coluna forem absolutamente necessários, use Visualizações ou funções definidas pelo usuário (UDF, na sigla em inglês).
Para informações sobre os formatos padrão que o Teradata SQL usa para cada tipo de dados, consulte a documentação em inglês Formatação padrão do Teradata.
Formatação de carimbo de data/hora e tipo de data
A tabela a seguir resume as diferenças nos elementos de formatação de carimbo de data/hora e de data entre o Teradata SQL e o GoogleSQL.
Formato Teradata | Descrição do Teradata | BigQuery |
---|---|---|
CURRENT_TIMESTAMP
|
As informações de TIME e TIMESTAMP no Teradata podem
ter dados de fuso horário diferentes, o que é definido usando WITH
TIME ZONE .
|
Se possível, use CURRENT_TIMESTAMP() , que tem o
formato ISO. No entanto, o formato de saída sempre mostra o fuso horário UTC.
Internamente, o BigQuery não tem um fuso horário.Observe os seguintes detalhes sobre as diferenças no formato ISO. DATETIME é formatado com base nas convenções do canal de saída. Na
ferramenta de linha de comando do BigQuery e no console
do BigQuery, ele é formatado usando um separador T de acordo com a RFC
3339. No entanto, em Python e Java JDBC, um espaço é usado como
separador.Se você quiser usar um formato explícito, use FORMAT_DATETIME() ,
que transforma uma transmissão explícita em uma string. Por exemplo, a expressão
a seguir sempre retorna um separador de espaço:CAST(CURRENT_DATETIME() AS STRING) O Teradata é compatível com uma palavra-chave DEFAULT em colunas TIME para definir a hora atual (carimbo de data/hora).
Isso não é usado no BigQuery.
|
CURRENT_DATE |
As datas são armazenadas no Teradata como valores INT64 usando a
seguinte fórmula:(YEAR - 1900) * 10000 + (MONTH * 100) + DAY As datas podem ser formatadas como números inteiros. |
O BigQuery tem um formato DATE separado que sempre
retorna uma data no formato ISO 8601.DATE_FROM_UNIX_DATE não pode ser usado porque é
baseado em 1970.O Teradata aceita uma palavra-chave DEFAULT
nas colunas DATE para definir a data atual. Isso não é
usado no BigQuery.
|
CURRENT_DATE-3 |
Os valores de data são representados como números inteiros. O Teradata é compatível com operadores aritméticos para tipos de data. |
Para tipos de data, use DATE_ADD()
ou
DATE_SUB() .O BigQuery usa operadores aritméticos para tipos de dados: INT64 , NUMERIC e FLOAT64 .
|
SYS_CALENDAR.CALENDAR |
O Teradata fornece uma visualização para operações de agenda que vão além de operações de número inteiro. | Não usado no BigQuery. |
SET SESSION DATEFORM=ANSIDATE |
Defina o formato de data da sessão ou do sistema como ANSI (ISO 8601). | O BigQuery sempre usa o ISO 8601. Portanto, converta datas e horários do Teradata. |
Sintaxe das consultas
Nesta seção, abordamos as diferenças na sintaxe de consulta entre o Teradata e o BigQuery.
Instrução SELECT
A maioria das instruções SELECT
(em inglês)
do Teradata
é compatível com o BigQuery. A tabela a seguir contém uma lista
de pequenas diferenças.
Teradata | BigQuery | |
---|---|---|
SEL |
Converta para SELECT . O BigQuery não usa a
abreviação SEL . |
|
SELECT
|
No BigQuery, as colunas não podem referenciar a saída de outras
colunas definidas na mesma lista de seleção. Prefira mover uma subconsulta para
uma cláusula WITH .
WITH flags AS (
|
|
SELECT * FROM table
|
O BigQuery não usa o predicado de lógica
ANY .A mesma funcionalidade pode ser alcançada usando vários operadores OR :SELECT * FROM table Nesse caso, a comparação de strings também é diferenciada. Consulte Operadores de comparação. |
|
SELECT TOP 10 * FROM table
|
O BigQuery usa LIMIT
no final de uma consulta em vez de TOP n após a
palavra-chave SELECT .
|
Operadores de comparação
A tabela a seguir mostra os operadores de comparação específicos do Teradata e que precisam ser convertidos em operadores compatíveis com ANSI SQL:2011 usados no BigQuery.
Para informações sobre operadores no BigQuery, consulte a seção Operadores da documentação do BigQuery.
Teradata | BigQuery | Observações |
---|---|---|
exp EQ exp2 exp IN (exp2, exp3)
|
exp = exp2 exp IN (exp2, exp3) Para manter a semântica não ANSI para NOT CASESPECIFIC , use RTRIM(UPPER(exp)) = RTRIM(UPPER(exp2))
|
Ao comparar strings por igualdade, o Teradata pode ignorar
espaços em branco posteriores, enquanto o BigQuery as considera parte da
string. Por exemplo, 'xyz'=' xyz' é TRUE no
Teradata, mas FALSE no BigQuery.O Teradata também fornece um atributo de coluna
NOT CASESPECIFIC que instrui o Teradata a ignorar
maiúsculas e minúsculas ao comparar duas strings. O BigQuery sempre especifica maiúsculas e minúsculas
ao comparar strings. Por exemplo, 'xYz' = 'xyz' é
TRUE no Teradata, mas FALSE no BigQuery.
|
exp LE exp2 |
exp <= exp2 |
|
exp LT exp2 |
exp < exp2 |
|
exp NE exp2 |
exp <> exp2
|
|
exp GE exp2 |
exp >= exp2 |
|
exp GT exp2 |
exp > exp2 |
JOIN
condição
O BigQuery e o Teradata são compatíveis com as mesmas condições JOIN
, ON
e USING
. A tabela a seguir
contém uma lista de pequenas diferenças.
Teradata | BigQuery | Observações |
---|---|---|
FROM A LEFT OUTER JOIN B ON A.date >
B.start_date AND A.date < B.end_date
|
FROM A LEFT OUTER JOIN (SELECT d FROM B JOIN
UNNEST(GENERATE_DATE_ARRAY(B.start_date, B.end_date)) d)
B ON A.date = B.date
|
O BigQuery aceita cláusulas de desigualdade JOIN para
todas as junções internas ou se pelo menos uma condição de igualdade for fornecida (=). Mas não
apenas uma condição de desigualdade (= and <) em um OUTER JOIN .
Essas construções às vezes são usadas para consultar intervalos de data ou inteiros.
O BigQuery impede que os usuários criem grandes junções cruzadas.
|
FROM A, B ON A.id = B.id
|
FROM A JOIN B ON A.id = B.id
|
O uso de uma vírgula entre tabelas no Teradata é igual a um INNER JOIN , enquanto no BigQuery é igual a um CROSS JOIN (produto cartesiano). Como a vírgula no SQL legado do BigQuery é tratada como UNION , recomendamos tornar a operação explícita para evitar confusão.
|
FROM A JOIN B ON
(COALESCE(A.id , 0) = COALESCE(B.id, 0))
|
FROM A JOIN B ON
(COALESCE(A.id , 0) = COALESCE(B.id, 0))
|
Não há diferença para funções escalares (constantes). |
FROM A JOIN B ON
A.id = (SELECT MAX(B.id) FROM B)
|
FROM A JOIN (SELECT MAX(B.id) FROM B)
B1 ON A.id = B1.id
|
O BigQuery impede que os usuários usem subconsultas, subconsultas correlacionadas ou agregações em predicados de junção. Isso permite que o BigQuery coloque as consultas em paralelo. |
Conversão e transmissão de tipo
O BigQuery tem menos tipos de dados, porém mais amplos que o Teradata, o que exige que o BigQuery seja mais rigoroso na transmissão.
Teradata | BigQuery | Observações |
---|---|---|
exp EQ exp2 exp IN (exp2, exp3)
|
exp = exp2 exp IN (exp2, exp3) Para manter a semântica não ANSI para NOT CASESPECIFIC , use RTRIM(UPPER(exp)) = RTRIM(UPPER(exp2))
|
Ao comparar strings por igualdade, o Teradata pode ignorar
espaços em branco posteriores, enquanto o BigQuery as considera parte da
string. Por exemplo, 'xyz'=' xyz' é TRUE no
Teradata, mas FALSE no BigQuery.O Teradata também fornece um atributo de coluna
NOT CASESPECIFIC que instrui o Teradata a ignorar
maiúsculas e minúsculas ao comparar duas strings. O BigQuery sempre especifica maiúsculas e minúsculas
ao comparar strings. Por exemplo, 'xYz' = 'xyz' é
TRUE no Teradata, mas FALSE no BigQuery.
|
CAST(long_varchar_column AS CHAR(6))
|
LPAD(long_varchar_column, 6)
|
A transmissão de uma coluna de caracteres no Teradata é usada às vezes como uma maneira não padrão e não ideal para criar uma substring preenchida. |
CAST(92617 AS TIME)
92617 (FORMAT '99:99:99')
|
PARSE_TIME("%k%M%S", CAST(92617 AS STRING)) |
O Teradata realiza muitas conversões de tipo implícitas (em inglês) e arredondamentos do que o BigQuery, que geralmente é mais rigoroso e aplica padrões ANSI.
(Este exemplo retorna 09:26:17) |
CAST(48.5 (FORMAT 'zz') AS FLOAT)
|
CAST(SUBSTR(CAST(48.5 AS STRING), 0, 2) AS FLOAT64) |
Os tipos de dados numéricos e de ponto flutuante podem exigir regras de arredondamento (em inglês) especiais, quando aplicados com formatos como moedas.
(Este exemplo retorna 48) |
Consulte também Operadores de comparação e formatos de coluna. As comparações e a formatação das colunas podem se comportar como os tipos de conversão.
Cláusulas QUALIFY
e ROWS
A cláusula QUALIFY
no Teradata permite que você
filtre os resultados para funções de janela (em inglês).
Como alternativa, uma
frase ROWS
(em inglês)
pode ser usada para a mesma tarefa. Isso funciona de maneira semelhante a uma condição HAVING
para uma
cláusula GROUP
, limitando a saída do que no BigQuery é
chamado de
funções de janela.
Teradata | BigQuery |
---|---|
SELECT col1, col2
|
A cláusula QUALIFY do Teradata com uma função
de janela como ROW_NUMBER() , SUM()
e COUNT() e com OVER PARTITION BY é expressa
no BigQuery como uma cláusula WHERE em uma subconsulta
que contém um valor de análise. Como usar o ROW_NUMBER() :SELECT col1, col2 Como usar o ARRAY_AGG , que é compatível com partições maiores:
SELECT
|
SELECT col1, col2
|
SELECT col1, col2 No BigQuery, RANGE e ROWS
podem ser usados na cláusula do frame da janela. No entanto, as cláusulas de janela só podem ser
usadas com funções de janela como AVG() , não com funções de
numeração como ROW_NUMBER() . |
Palavra-chave NORMALIZE
O Teradata fornece a
palavra-chave NORMALIZE
para cláusulas SELECT
para aglutinar períodos ou intervalos sobrepostos em
um período ou intervalo que englobe todos os valores de períodos individuais.
O BigQuery não é compatível com o tipo PERIOD
. Portanto, qualquer coluna com tipo
PERIOD
no Teradata precisa ser inserido no BigQuery como dois campos
DATE
ou DATETIME
separados que correspondem ao início e ao fim do
período.
Teradata | BigQuery |
---|---|
SELECT NORMALIZE
|
SELECT
|
Funções
As seções a seguir listam mapeamentos entre funções do Teradata e equivalentes do BigQuery.
Funções de agregação
A tabela a seguir correlaciona funções comuns de agregação, agregação estatística e agregação aproximada do Teradata com os equivalentes do BigQuery. O BigQuery oferece as seguintes funções extras de agregação:
ANY_VALUE
APPROX_COUNT_DISTINCT
APPROX_QUANTILES
APPROX_TOP_COUNT
APPROX_TOP_SUM
COUNTIF
LOGICAL_AND
LOGICAL_OR
STRING_AGG
Teradata | BigQuery |
---|---|
AVG |
AVG |
BITAND |
BIT_AND |
BITNOT |
Lógica binária
não operadora (~ ) |
BITOR |
BIT_OR |
BITXOR |
BIT_XOR |
CORR |
CORR |
COUNT |
COUNT |
COVAR_POP |
COVAR_POP |
COVAR_SAMP |
COVAR_SAMP |
MAX |
MAX |
MIN |
MIN |
REGR_AVGX |
AVG( |
REGR_AVGY |
AVG( |
REGR_COUNT |
SUM( |
REGR_INTERCEPT |
AVG(dep_var_expression) - AVG(ind_var_expression) *
(COVAR_SAMP(ind_var_expression,
|
REGR_R2 |
(COUNT(dep_var_expression)* |
REGR_SLOPE |
- COVAR_SAMP(ind_var_expression, |
REGR_SXX |
SUM(POWER(ind_var_expression, 2)) -
COUNT(ind_var_expression) * |
REGR_SXY |
SUM(ind_var_expression * dep_var_expression) -
COUNT(ind_var_expression) |
REGR_SYY |
SUM(POWER(dep_var_expression, 2)) -
COUNT(dep_var_expression) |
SKEW |
Função personalizada definida pelo usuário. |
STDDEV_POP |
STDDEV_POP |
STDDEV_SAMP |
STDDEV_SAMP,
STDDEV |
SUM |
SUM |
VAR_POP |
VAR_POP |
VAR_SAMP |
VAR_SAMP,
VARIANCE |
Funções de análise e de janela
A tabela a seguir correlaciona funções comuns de análise e agregadas do Teradata com os equivalentes da função de janela do BigQuery. O BigQuery oferece as seguintes funções adicionais:
Funções de data/hora
A tabela a seguir correlaciona funções comuns de data/hora do Teradata com os equivalentes do BigQuery. O BigQuery oferece as seguintes funções extras de data/hora:
CURRENT_DATETIME
DATE_ADD
DATE_DIFF
DATE_FROM_UNIX_DATE
DATE_SUB
DATE_TRUNC
DATETIME
DATETIME_ADD
DATETIME_DIFF
DATETIME_SUB
DATETIME_TRUNC
PARSE_DATE
PARSE_DATETIME
PARSE_TIME
PARSE_TIMESTAMP
STRING
TIME
TIME_ADD
TIME_DIFF
TIME_SUB
TIME_TRUNC
TIMESTAMP
TIMESTAMP_ADD
TIMESTAMP_DIFF
TIMESTAMP_MICROS
TIMESTAMP_MILLIS
TIMESTAMP_SECONDS
TIMESTAMP_SUB
TIMESTAMP_TRUNC
UNIX_DATE
UNIX_MICROS
UNIX_MILLIS
UNIX_SECONDS
Teradata | BigQuery |
---|---|
ADD_MONTHS |
DATE_ADD,
TIMESTAMP_ADD
|
CURRENT_DATE |
CURRENT_DATE
|
CURRENT_TIME |
CURRENT_TIME
|
CURRENT_TIMESTAMP |
CURRENT_TIMESTAMP
|
DATE + k |
DATE_ADD(date_expression,
INTERVAL k DAY)
|
DATE - k |
DATE_SUB(date_expression,
INTERVAL k DAY)
|
EXTRACT |
EXTRACT(DATE),
EXTRACT(TIMESTAMP)
|
FORMAT_DATE
|
|
FORMAT_DATETIME
|
|
FORMAT_TIME
|
|
FORMAT_TIMESTAMP
|
|
LAST_DAY |
LAST_DAY
Observação: esta função é compatível com as expressões de entrada DATE e DATETIME .
|
MONTHS_BETWEEN |
DATE_DIFF(date_expression, date_expression, MONTH)
|
NEXT_DAY |
DATE_ADD( |
OADD_MONTHS |
DATE_SUB( |
td_day_of_month |
EXTRACT(DAY FROM date_expression) |
td_day_of_week |
EXTRACT(DAYOFWEEK FROM date_expression) |
td_day_of_year |
EXTRACT(DAYOFYEAR FROM date_expression) |
td_friday |
DATE_TRUNC( |
td_monday |
DATE_TRUNC( |
td_month_begin |
DATE_TRUNC(date_expression, MONTH)
|
td_month_end |
DATE_SUB( |
td_month_of_calendar |
(EXTRACT(YEAR FROM date_expression) - 1900) * 12 + EXTRACT(MONTH FROM date_expression)
|
td_month_of_quarter |
EXTRACT(MONTH FROM date_expression) |
td_month_of_year |
EXTRACT(MONTH FROM date_expression) |
td_quarter_begin |
DATE_TRUNC(date_expression, QUARTER)
|
td_quarter_end |
DATE_SUB( |
td_quarter_of_calendar |
(EXTRACT(YEAR FROM date_expression) |
td_quarter_of_year |
EXTRACT(QUARTER FROM date_expression) |
td_saturday |
DATE_TRUNC( |
td_sunday |
DATE_TRUNC( |
td_thursday |
DATE_TRUNC( |
td_tuesday |
DATE_TRUNC( |
td_wednesday |
DATE_TRUNC( |
td_week_begin |
DATE_TRUNC(date_expression, WEEK)
|
td_week_end |
DATE_SUB( |
td_week_of_calendar |
(EXTRACT(YEAR FROM date_expression) - 1900) * 52 + EXTRACT(WEEK FROM date_expression)
|
td_week_of_month |
EXTRACT(WEEK FROM date_expression) |
td_week_of_year |
EXTRACT(WEEK FROM date_expression) |
td_weekday_of_month |
CAST( |
td_year_begin |
DATE_TRUNC(date_expression, YEAR)
|
td_year_end |
DATE_SUB( |
td_year_of_calendar |
EXTRACT(YEAR FROM date_expression)
|
TO_DATE |
PARSE_DATE
|
TO_TIMESTAMP |
PARSE_TIMESTAMP
|
TO_TIMESTAMP_TZ |
PARSE_TIMESTAMP
|
Funções de string
A tabela a seguir correlaciona as funções comuns de string do Teradata com os equivalentes do BigQuery. O BigQuery oferece as seguintes funções extras de string:
BYTE_LENGTH
CODE_POINTS_TO_BYTES
ENDS_WITH
FROM_BASE32
FROM_BASE64
FROM_HEX
NORMALIZE
NORMALIZE_AND_CASEFOLD
REGEXP_CONTAINS
REGEXP_EXTRACT
REGEXP_EXTRACT_ALL
REPEAT
REPLACE
SAFE_CONVERT_BYTES_TO_STRING
SPLIT
STARTS_WITH
STRPOS
TO_BASE32
TO_BASE64
TO_CODE_POINTS
TO_HEX
Teradata | BigQuery |
---|---|
ASCII |
TO_CODE_POINTS(string_expression)[OFFSET(0)]
|
CHAR2HEXINT |
TO_HEX
|
CHARACTER LENGTH |
CHAR_LENGTH
|
CHARACTER LENGTH |
CHARACTER_LENGTH
|
CHR |
CODE_POINTS_TO_STRING( |
CONCAT, (|| operator) |
CONCAT, (|| operator)
|
CSV |
Função personalizada definida pelo usuário. |
CSVLD |
Função personalizada definida pelo usuário. |
FORMAT |
FORMAT
|
INDEX |
STRPOS(string, substring)
|
INITCAP |
INITCAP |
INSTR |
Função personalizada definida pelo usuário. |
LEFT |
SUBSTR(source_string, 1, length)
|
LENGTH |
LENGTH
|
LOWER |
LOWER
|
LPAD |
LPAD
|
LTRIM |
LTRIM
|
NGRAM |
Função personalizada definida pelo usuário. |
NVP |
Função personalizada definida pelo usuário. |
OREPLACE |
REPLACE
|
OTRANSLATE |
Função personalizada definida pelo usuário. |
POSITION |
STRPOS(string, substring)
|
REGEXP_INSTR |
STRPOS(source_string, Observação: retorna a primeira ocorrência. |
REGEXP_REPLACE |
REGEXP_REPLACE |
REGEXP_SIMILAR |
IF(REGEXP_CONTAINS,1,0) |
REGEXP_SUBSTR |
REGEXP_EXTRACT, |
REGEXP_SPLIT_TO_TABLE |
Função personalizada definida pelo usuário. |
REVERSE |
REVERSE
|
RIGHT |
SUBSTR(source_string, -1, length)
|
RPAD |
RPAD
|
RTRIM |
RTRIM
|
STRTOK Observação: cada caractere no argumento da string do delimitador é considerado um caractere delimitador separado. O delimitador padrão é um caractere de espaço. |
SPLIT(instring, delimiter)[ORDINAL(tokennum)] Observação: todo o argumento da string do delimitador é usado como um único delimitador. O delimitador padrão é uma vírgula. |
STRTOK_SPLIT_TO_TABLE |
Função personalizada definida pelo usuário |
SUBSTRING , SUBSTR |
SUBSTR
|
TRIM |
TRIM
|
UPPER |
UPPER
|
Funções matemáticas
A tabela a seguir correlaciona as funções matemáticas do Teradata com os equivalentes do BigQuery. O BigQuery oferece as seguintes funções matemáticas extras:
Teradata | BigQuery |
---|---|
ABS |
ABS |
ACOS |
ACOS |
ACOSH |
ACOSH |
ASIN |
ASIN |
ASINH |
ASINH |
ATAN |
ATAN |
ATAN2 |
ATAN2 |
ATANH |
ATANH |
CEILING |
CEIL |
CEILING |
CEILING |
COS |
COS |
COSH |
COSH |
EXP |
EXP |
FLOOR |
FLOOR |
GREATEST |
GREATEST |
LEAST |
LEAST |
LN |
LN |
LOG |
LOG |
MOD (operador % ) |
MOD |
NULLIFZERO |
NULLIF(expression, 0) |
POWER (operador ** ) |
POWER,
POW
|
RANDOM |
RAND |
ROUND |
ROUND |
SIGN |
SIGN |
SIN |
SIN |
SINH |
SINH |
SQRT |
SQRT |
TAN |
TAN |
TANH |
TANH |
TRUNC |
TRUNC |
ZEROIFNULL |
IFNULL(expression, 0),
COALESCE(expression, 0)
|
Sintaxe DML
Esta seção aborda as diferenças na sintaxe da linguagem de gerenciamento de dados entre o Teradata e o BigQuery.
Instrução INSERT
A maioria das instruções INSERT
do Teradata é compatível com o BigQuery.
A tabela a seguir mostra as exceções.
Os scripts DML no BigQuery têm semânticas de consistência ligeiramente
diferentes das instruções equivalentes no Teradata. Para uma visão geral do
isolamento de snapshot e do processamento de sessões e transações, consulte a
seção CREATE INDEX
em outras partes deste documento.
Teradata | BigQuery |
---|---|
INSERT INTO table VALUES (...);
|
INSERT INTO
table (...) VALUES (...); O Teradata oferece uma palavra-chave DEFAULT para colunas não anuláveis.Observação: no BigQuery, a omissão de nomes de coluna na instrução INSERT funcionará somente se os valores de todas as colunas na
tabela de destino forem incluídos em ordem crescente com base nas posições
ordinais. |
INSERT INTO table VALUES (1,2,3);
|
INSERT INTO
table VALUES (1,2,3),
O Teradata tem um conceito de solicitação de várias instruções (MSR, na sigla em inglês), que envia várias instruções INSERT
por vez (link em inglês). No BigQuery, isso não é recomendado devido ao
limite de transação implícito entre as instruções.
Use vários valores
INSERT .O BigQuery permite instruções INSERT simultâneas, mas pode enfileirar UPDATE .
Para melhorar o desempenho, considere as seguintes abordagens:
|
Instrução UPDATE
A maioria
das instruções UPDATE
do Teradata (em inglês)
é compatível com o BigQuery, exceto os seguintes itens:
- Quando você usa uma cláusula
FROM
, a ordem das cláusulasFROM
eSET
é revertida no Teradata e no BigQuery. - No GoogleSQL, cada instrução
UPDATE
precisa incluir a palavra-chaveWHERE
, seguida por uma condição. Para atualizar todas as linhas da tabela, useWHERE true
.
Como prática recomendada, você precisa agrupar várias mutações DML em vez de instruções UPDATE
e INSERT
únicas. Os scripts DML no BigQuery têm
uma semântica de consistência ligeiramente diferente das declarações equivalentes no Teradata.
Para uma visão geral do isolamento de snapshot e do processamento de sessões e transações, consulte
a
seção CREATE INDEX
em outras partes deste documento.
A tabela a seguir mostra instruções UPDATE
do Teradata e
instruções do BigQuery que realizam as mesmas tarefas.
Para mais informações sobre UPDATE
no BigQuery, consulte os
exemplos de UPDATE
do BigQuery
na documentação do DML.
Teradata | BigQuery | |
---|---|---|
UPDATE table_A
|
UPDATE table_A
|
|
UPDATE table alias
|
UPDATE table
|
|
UPDATE table_A
|
UPDATE table_A
|
Declarações DELETE
e TRUNCATE
.
As instruções DELETE
e TRUNCATE
são maneiras de remover linhas de uma
tabela sem afetar o esquema ou os índices dela. TRUNCATE
não é usado no
Teradata nem no BigQuery. No entanto, é possível usar DELETE
para ter o mesmo efeito.
No BigQuery, a instrução DELETE
precisa ter uma cláusula WHERE
.
Para excluir todas as linhas da tabela (truncate), use WHERE true
. Para acelerar as operações de truncamento de tabelas muito grandes, recomendamos usar a instrução CREATE OR REPLACE TABLE ... AS SELECT
, usando um LIMIT 0
na mesma tabela para que substitua a si mesmo. No entanto,
adicione manualmente as informações de particionamento e clustering.
Os gravadores do Teradata foram excluídos posteriormente. Isso significa que as operações DELETE
são inicialmente mais rápidas do que no BigQuery, mas exigem recursos mais tarde, especialmente as operações DELETE
em grande escala que afetam a maioria de uma tabela. Para usar uma abordagem semelhante no BigQuery, sugerimos reduzir o número de operações DELETE
, como copiar as linhas que não serão excluídas em uma nova tabela. Como alternativa, é possível remover partições inteiras.
Ambas as opções foram projetadas para serem operações mais rápidas do que mutações DML atômicas.
Para mais informações sobre DELETE
no BigQuery, consulte os
exemplos de DELETE
na documentação do DML.
Teradata | BigQuery |
---|---|
BEGIN TRANSACTION;
|
Substituir o conteúdo de uma tabela pela saída da consulta é equivalente a uma
transação. É possível fazer isso com uma operação de consulta
ou
de cópia. Como usar uma operação de consulta:
bq query --replace --destination_table table_A 'SELECT * FROM table_B';
Como usar uma operação de cópia: bq cp -f table_A table_B |
DELETE database.table ALL; |
DELETE FROM table WHERE TRUE; Para tabelas muito grandes, uma maneira mais rápida: CREATE OR REPLACE table AS SELECT * FROM table LIMIT 0;
|
Instrução MERGE
A instrução MERGE
pode combinar operações INSERT
, UPDATE
e DELETE
em uma única instrução "upsert" e realizar as operações de maneira atômica. A
operação MERGE
precisa corresponder no máximo a uma linha de origem para cada linha de destino.
O BigQuery e o Teradata seguem a sintaxe ANSI.
A operação MERGE
do Teradata está limitada a correspondência de chaves primárias em um processador do módulo de acesso, ou AMP, na sigla em inglês (link em inglês).
Por outro lado, o BigQuery não tem limite de tamanho ou coluna para operações MERGE
. Portanto, usar MERGE
é uma otimização útil. No entanto, se MERGE
for basicamente uma exclusão grande, consulte otimizações para DELETE
em outro lugar neste documento.
Os scripts DML no BigQuery têm
uma semântica de consistência ligeiramente diferente das declarações equivalentes no Teradata. Por exemplo,
as tabelas SET do Teradata no modo de sessão podem
ignorar cópias (em inglês)
durante uma operação MERGE
. Para uma visão geral sobre como lidar com tabelas
MULTISET e SET, isolamento de snapshot e processamento de sessões e transações,
consulte a
seção CREATE INDEX
em outro lugar deste documento.
Variáveis afetadas por linhas
No Teradata, a
variável ACTIVITY_COUNT
(em inglês)
é uma extensão ANSI SQL do Teradata preenchida com o número de linhas
afetadas por uma instrução DML.
A variável de sistema @@row_count
no recurso de script tem uma funcionalidade semelhante.
No BigQuery, seria mais comum verificar o valor de retorno numDmlAffectedRows
nos registros de auditoria ou nas visualizações INFORMATION_SCHEMA
.
Sintaxe DDL
Nesta seção, abordamos as diferenças na sintaxe da linguagem de definição de dados entre o Teradata e o BigQuery.
Instrução CREATE TABLE
A maioria das instruções
CREATE TABLE
(em inglês)
do Teradata são compatíveis com o BigQuery, exceto pelos seguintes
elementos de sintaxe, que não são usados no BigQuery:
MULTISET
. Consulte a seçãoCREATE INDEX
.VOLATILE
. Consulte a seção Tabelas temporárias.[NO] FALLBACK
. Consulte a seção Reverter.[NO] BEFORE JOURNAL
,[NO] AFTER JOURNAL
CHECKSUM = DEFAULT | val
DEFAULT MERGEBLOCKRATIO
PRIMARY INDEX (col, ...)
. Consulte a seçãoCREATE INDEX
.UNIQUE PRIMARY INDEX
. Consulte a seçãoCREATE INDEX
.CONSTRAINT
DEFAULT
IDENTITY
Para mais informações sobre CREATE TABLE
no BigQuery, consulte os
exemplos de CREATE
do BigQuery
na documentação do DML.
Atributos e opções de coluna
As seguintes especificações de coluna para a instrução CREATE TABLE
não são
usadas no BigQuery:
FORMAT 'format'
. Consulte a seção sobre formatação de tipos do Teradata.CHARACTER SET name
. O BigQuery sempre usa a codificação UTF-8.[NOT] CASESPECIFIC
COMPRESS val | (val, ...)
O Teradata estende o padrão ANSI com uma opção de
coluna
TITLE
(em inglês). Esse recurso pode ser implementado de maneira semelhante no BigQuery
usando a descrição da coluna, conforme mostrado na tabela a seguir. Essa opção
não está disponível para visualizações.
Teradata | BigQuery |
---|---|
CREATE TABLE table (
|
CREATE TABLE dataset.table (
|
Tabelas temporárias
O Teradata é compatível com tabelas voláteis (em inglês), que costumam ser usadas para armazenar resultados intermediários em scripts. Há várias maneiras de conseguir algo semelhante a tabelas voláteis no BigQuery:
CREATE TEMPORARY TABLE
pode ser usado em Scripts e é válido durante a vida útil do script. Se a tabela tiver que existir além de um script, use as outras opções nesta lista.Tempo de vida (TTL, na sigla em inglês) do conjunto de dados: crie um conjunto de dados que tenha um curto tempo de vida, por exemplo, uma hora, para que as tabelas criadas no conjunto de dados sejam efetivamente temporárias, já que não permanecerão por mais tempo do que o tempo de vida do conjunto de dados. É possível prefixar todos os nomes de tabela neste conjunto de dados com
temp
para indicar claramente que as tabelas são temporárias.Tempo de vida (TTL, na sigla em inglês) da tabela: crie uma tabela que tenha um curto tempo de vida específico usando instruções DDL semelhantes às seguintes:
CREATE TABLE temp.name (col1, col2, ...) OPTIONS(expiration_timestamp=TIMESTAMP_ADD(CURRENT_TIMESTAMP(), INTERVAL 1 HOUR));
Cláusula
WITH
: se uma tabela temporária for necessária apenas dentro do mesmo bloco, use um resultado temporário usando uma instrução ou subconsultaWITH
. Essa é a opção mais eficiente.
Um padrão usado com frequência em scripts do Teradata (BTEQ) é criar uma tabela permanente, inserir um valor nela, usá-la como uma tabela temporária em instruções contínuas e depois excluir ou truncar a tabela (link em inglês).
Na verdade, ele usa a tabela como uma variável constante (um parâmetro). Essa abordagem não é eficiente no BigQuery, mas recomendamos o uso de variáveis reais no Script ou o uso de CREATE OR REPLACE
com a sintaxe de consulta AS SELECT
para criar uma tabela que já tenha valores.
Instrução CREATE VIEW
A tabela a seguir mostra equivalentes entre o Teradata e
o BigQuery para a instrução CREATE VIEW
. As cláusulas para bloqueio
de tabelas, como
LOCKING ROW FOR ACCESS
(em inglês),
não são necessárias no BigQuery.
Teradata | BigQuery | Observações |
---|---|---|
CREATE VIEW view_name AS SELECT ...
|
CREATE VIEW
view_name AS SELECT ...
|
|
REPLACE VIEW view_name AS SELECT ...
|
CREATE OR REPLACE VIEW
|
|
Não compatível |
CREATE VIEW IF NOT EXISTS
|
Cria uma nova visualização somente se ela não existir no conjunto de dados especificado. |
Instrução CREATE [UNIQUE] INDEX
O Teradata requer índices para todas as tabelas e exige soluções alternativas, como tabelas MULTISET e NoPI (links em inglês), para trabalhar com dados que não sejam exclusivos nem indexados.
O BigQuery não requer índices. Nesta seção, descrevemos abordagens no BigQuery para saber como criar funcionalidades semelhantes à maneira como os índices são usados no Teradata, onde há uma necessidade real de lógica de negócios.
Indexação de desempenho
Por ser um banco de dados orientado a colunas com otimização de consulta e armazenamento, o BigQuery não precisa de índices explícitos. O BigQuery oferece funcionalidades como particionamento e clustering, bem como campos aninhados, que podem aumentar a eficiência e o desempenho da consulta otimizando como os dados são armazenados.
O Teradata não é compatível com visualizações materializadas. No entanto, ele oferece
índices de mesclagem (em inglês)
usando a instrução CREATE JOIN INDEX
, que basicamente materializa os dados
necessários para uma mesclagem. O BigQuery não precisa de índices materializados para acelerar o desempenho, assim como não precisa de espaço dedicado do spool para junções.
Para outros casos de otimização, é possível usar visualizações materializadas.
Indexação de consistência (UNIQUE, PRIMARY INDEX)
No Teradata, um índice exclusivo pode ser usado para evitar linhas com chaves não exclusivas em uma tabela. Se um processo tentar inserir ou atualizar dados com um valor que já está no índice, a operação falhará com uma violação de índice (tabelas MULTISET) ou ignorará silenciosamente (SET).
Como o BigQuery não fornece índices explícitos, uma instrução
MERGE
pode ser usada para inserir somente registros exclusivos em uma tabela de destino
de uma tabela de preparo e descartando registros duplicados. No entanto, não há como impedir que um usuário com permissões para edição insira um registro duplicado porque o BigQuery nunca pode ser bloqueado durante as operações INSERT
.
Para gerar um erro para registros duplicados no BigQuery, use uma instrução MERGE
de uma tabela de preparo, conforme mostrado no exemplo a seguir.
Teradata | BigQuery | |
---|---|---|
CREATE [UNIQUE] INDEX name;
|
MERGE `prototype.FIN_MERGE` t
|
Com mais frequência, os usuários preferem
remover cópias duplicadas de maneira independente
para encontrar erros nos sistemas posteriores.
O BigQuery não é compatível com as colunas DEFAULT
e IDENTITY
(sequências).
Indexação para conseguir o bloqueio
O Teradata fornece recursos no
processador de módulo de acesso
(AMP, na sigla em inglês). As consultas podem consumir recursos totalmente AMP, de um AMP ou AMP de grupos (link em inglês). As instruções
DDL são totalmente AMP e, portanto, semelhantes a um bloqueio DDL global.
O BigQuery não tem um mecanismo de bloqueio como esse e pode executar consultas simultâneas e instruções INSERT
até sua cota. Somente instruções DML UPDATE
simultâneas têm certas implicações de simultaneidade: as operações UPDATE
na mesma partição são colocadas na fila para garantir o isolamento do snapshot. Portanto, não é necessário um bloqueio para prevenir as leituras fantasma ou perder atualizações.
Devido a essas diferenças, os seguintes elementos do Teradata não são usados no BigQuery:
ON COMMIT DELETE ROWS;
ON COMMIT PRESERVE ROWS;
Instruções SQL procedurais
Nesta seção, descrevemos como converter instruções SQL processuais usadas em procedimentos, funções e gatilhos armazenados do Teradata para scripts, procedimentos ou funções definidas pelo usuário (UDFs, na sigla em inglês) do BigQuery.
Todas essas opções estão disponíveis para que os administradores do sistema possam verificar por meio das visualizações INFORMATION_SCHEMA
.
Instrução CREATE PROCEDURE
Os procedimentos armazenados são aceitos como parte dos Scripts do BigQuery.
No BigQuery, os scripts se referem a qualquer uso de instruções de controle, enquanto os procedimentos são chamados de scripts (com argumentos, se necessário), que podem ser chamados de outros scripts e armazenados permanentemente, se necessário. Uma função definida pelo usuário (UDF, na sigla em inglês) também pode ser escrita em JavaScript.
Teradata | BigQuery |
---|---|
CREATE PROCEDURE |
CREATE PROCEDURE quando um nome for necessário. Caso contrário, use in-line com BEGIN ou em uma única linha com CREATE TEMP FUNCTION .
|
REPLACE PROCEDURE |
CREATE OR REPLACE PROCEDURE |
CALL |
CALL |
As seções a seguir descrevem maneiras de converter instruções processuais atuais do Teradata em instruções de script do BigQuery que têm funcionalidade semelhante.
Declaração e atribuição de variáveis
As variáveis do BigQuery são válidas durante o ciclo de vida do script.
Teradata | BigQuery |
---|---|
DECLARE |
DECLARE |
SET |
SET |
Gerenciadores de condição de erro
O Teradata usa gerenciadores em códigos de status em procedimentos de controle de erros. No
BigQuery, o tratamento de erros é um recurso principal do fluxo de controle
principal. Ele é semelhante ao fornecido por outros idiomas com blocos TRY ... CATCH
.
Teradata | BigQuery |
---|---|
DECLARE EXIT HANDLER
FOR SQLEXCEPTION |
BEGIN ... EXCEPTION WHEN ERROR THEN |
SIGNAL sqlstate |
RAISE message |
DECLARE CONTINUE HANDLER
FOR SQLSTATE VALUE 23505; |
Os gerenciadores de exceções acionados em determinadas condições de erro não são usados pelo BigQuery. Recomendamos o uso de instruções ASSERT em que as condições de saída são utilizadas para verificações prévias ou depuração, porque isso está em compliance com o ANSI SQL:2011. |
A variável SQLSTATE
(em inglês) na Teradata é semelhante à variável de sistema @@error
no BigQuery. No BigQuery, é mais comum
investigar erros usando a geração de registros de auditoria
ou as visualizações
INFORMATION_SCHEMA
.
Declarações e operações do cursor
Como o BigQuery não é compatível com cursores ou sessões, as seguintes instruções não são usadas no BigQuery:
DECLARE cursor_name CURSOR [FOR | WITH] ...
PREPARE stmt_id FROM sql_str;
OPEN cursor_name [USING var, ...];
FETCH cursor_name INTO var, ...;
CLOSE cursor_name;
Instruções SQL dinâmicas
O recurso de criação de script no BigQuery é compatível com instruções SQL dinâmicas, como as mostradas na tabela a seguir.
Teradata | BigQuery |
---|---|
EXECUTE IMMEDIATE
sql_str; |
EXECUTE IMMEDIATE
sql_str; |
EXECUTE
stmt_id [USING var,...]; |
EXECUTE IMMEDIATE
stmt_id USING var; |
As seguintes instruções SQL dinâmicas não são usadas no BigQuery:
PREPARE stmt_id FROM sql_str;
Instruções de fluxo de controle
O recurso de script no BigQuery é compatível com instruções de fluxo de controle como as mostradas na tabela a seguir.
Teradata | BigQuery |
---|---|
IF condition THEN stmts ELSE stmts END IF
|
IF condition THEN stmts ELSE stmts END IF |
label_name: LOOP stmts END LOOP label_name;
|
Construções de blocos no estilo GOTO não são usadas no BigQuery. É recomendável gravá-las novamente como funções definidas pelo usuário (UDFs) ou utilizar instruções ASSERT em que as construções são usadas para lidar com de erros.
|
REPEAT stmts UNTIL condition END REPEAT;
|
WHILE condition DO stmts END WHILE |
LEAVE outer_proc_label;
|
LEAVE não é usado para blocos no estilo GOTO, ele é usado como sinônimo de BREAK para deixar um loop WHILE . |
LEAVE label;
|
LEAVE não é usado para blocos no estilo GOTO, ele é usado como sinônimo de BREAK para deixar um loop WHILE . |
WITH RECURSIVE temp_table AS ( ... );
|
Consultas recorrentes, também conhecidas como expressões recorrentes de tabela comum (CTE, na sigla em inglês), não são usadas no BigQuery. Elas podem ser gravadas novamente usando matrizes de
UNION ALL . |
As instruções de fluxo de controle a seguir não são usadas no BigQuery porque o BigQuery não usa cursores ou sessões:
Instruções SQL de metadados e transações
Teradata | BigQuery |
---|---|
HELP TABLE table_name;
HELP VIEW view_name;
|
SELECT A mesma consulta é válida para receber informações de coluna para visualizações. Para mais informações, consulte a Visualização de colunas no INFORMATION_SCHEMA do BigQuery. |
SELECT * FROM dbc.tables WHERE tablekind = 'T'; (visualização do Teradata DBC) |
SELECT Para mais informações, consulte Introdução ao BigQuery INFORMATION_SCHEMA . |
HELP STATISTICS table_name; |
APPROX_COUNT_DISTINCT(col) |
COLLECT STATS USING SAMPLE ON table_name column (...); |
Não usado no BigQuery. |
LOCKING TABLE table_name FOR EXCLUSIVE; |
O BigQuery sempre usa o isolamento de snapshot. Para ver detalhes, consulte Garantias de consistência em outras partes deste documento. |
SET SESSION CHARACTERISTICS AS TRANSACTION ISOLATION LEVEL ... |
O BigQuery sempre usa o isolamento de snapshot. Para ver detalhes, consulte Garantias de consistência em outras partes deste documento. |
BEGIN TRANSACTION; |
O BigQuery sempre usa o isolamento de snapshot. Para ver detalhes, consulte Garantias de consistência em outras partes deste documento. |
EXPLAIN ... |
Não usado no BigQuery. Recursos semelhantes são as explicações do plano de consulta na IU da Web do BigQuery e a alocação visível de slots nas visualizações INFORMATION_SCHEMA e no registro de auditoria no Cloud Monitoring. |
Instruções SQL com várias instruções e linhas
O Teradata e o BigQuery aceitam transações (sessões) e, portanto, são compatíveis com instruções separadas por ponto e vírgula que são executados consistentemente em conjunto. Para mais informações, consulte Transações de várias instruções.
Mensagens e códigos de erro
Os códigos de erro do Teradata e do BigQuery são diferentes. Ao fornecer uma API REST, o BigQuery depende principalmente de códigos de status HTTP, além de mensagens de erro detalhadas.
Se a lógica do aplicativo estiver detectando os erros a seguir, tente eliminar a origem do erro, já que o BigQuery não retornará os mesmos códigos de erro.
SQLSTATE = '02000'
— "Linha não encontrada"SQLSTATE = '21000'
— "Violação de cardinalidade (índice exclusivo)"SQLSTATE = '22000'
— "Violação de dados (tipo de dados)"SQLSTATE = '23000'
— "Violação de restrição"
No BigQuery, seria mais comum usar as visualizações INFORMATION_SCHEMA
ou a geração de registros de auditoria para detalhar erros.
Para informações sobre como lidar com erros em scripts, consulte as seções a seguir.
Garantias de consistência e isolamento da transação
O Teradata e o BigQuery são atômicos, ou seja, estão em conformidade com ACID em
um nível por mutação em muitas linhas. Por exemplo, uma operação MERGE
é
completamente atômica, mesmo com vários valores inseridos e atualizados.
Transações
O Teradata fornece nível de isolamento (em inglês) de transações não confirmadas (que permite leituras sujas) ou serializáveis ao executar no modo de sessão, em vez do modo de confirmação automática. Na melhor das hipóteses, o Teradata atinge um isolamento estritamente serializável usando o bloqueio pessimista em um hash de linha em todas as colunas de linhas em todas as partições. Os impasses são possíveis. A DDL sempre força um limite de transação. Os jobs do Teradata Fastload são executados de maneira independente, mas somente em tabelas vazias.
O BigQuery também
tem suporte a transações.
O BigQuery ajuda a garantir
o controle de simultaneidade otimista
(primeiro a confirmar) com o
isolamento de snapshot,
em que uma consulta lê os últimos dados confirmados antes do início da consulta. Essa
abordagem garante o mesmo nível de consistência por linha, por mutação
e em todas as linhas da mesma instrução DML, evitando impasses. No caso de várias instruções UPDATE
na mesma tabela, o BigQuery muda para o controle de simultaneidade pessimista e para várias instruções UPDATE
das filas. Elas são repetidas automaticamente em caso de conflitos. A Instrução DML INSERT
e os jobs de carregamento podem ser executados de maneira simultânea e independente para anexar às tabelas.
Reverter
O Teradata é compatível com
dois modos de reversão de sessão (em inglês),
modo de sessão ANSI e modo de sessão Teradata (SET SESSION CHARACTERISTICS
e SET SESSION TRANSACTION
), dependendo do modo de reversão que você quer. Em
casos de falha, a transação pode não ser revertida.
O BigQuery oferece suporte à
instrução ROLLBACK TRANSACTION
.
Não há instrução ABORT
no BigQuery.
Limites de bancos de dados
Sempre verifique a documentação pública do BigQuery para ver as cotas e os limites mais recentes. Muitas cotas para usuários de grandes volumes podem ser geradas entrando em contato com a equipe de suporte do Cloud. A tabela a seguir mostra uma comparação dos limites do banco de dados do Teradata e do BigQuery.
Limite | Teradata | BigQuery |
---|---|---|
Tabelas por banco de dados | Irrestrito | Irrestrito |
Colunas por tabela | 2.048 | 10.000 |
Tamanho máximo da linha | 1 MB | 100 MB |
Tamanho do nome da coluna e da tabela | 128 caracteres Unicode | 16.384 caracteres Unicode |
Linhas por tabela | Ilimitado | Ilimitado |
Tamanho máximo da solicitação SQL | 1 MB | 1 MB (tamanho máximo da consulta GoogleSQL não resolvida) 12 MB (tamanho máximo da consulta legada e do GoogleSQL resolvida) Streaming:
|
Tamanho máximo da solicitação e da resposta | 7 MB (solicitação), 16 MB (resposta) | 10 MB (solicitação) e 10 GB (resposta), ou praticamente ilimitado se você usar paginação ou a API Cloud Storage. |
Número máximo de sessões simultâneas | 120 por mecanismo de análise (PE, na sigla em inglês) | 100 consultas simultâneas (podem ser geradas com uma reserva de local), 300 solicitações de API simultâneas por usuário. |
Número máximo de carregamentos simultâneos (rápidos) | 30 (o padrão é 5) | Nenhum limite de simultaneidade. Jobs estão na fila. 100.000 jobs de carregamento por projeto por dia. |