Questa pagina è stata tradotta dall'API Cloud Translation.

Guida alla traduzione SQL di Amazon Redshift

Questo documento descrive in dettaglio le somiglianze e le differenze nella sintassi SQL tra Amazon Redshift e BigQuery per aiutarti a pianificare la migrazione. Utilizza la traduzione SQL batch per migrare gli script SQL in blocco oppure la traduzione SQL interattiva per tradurre le query ad hoc.

Il pubblico di destinazione di questa guida è costituito da architetti aziendali, amministratori di database, sviluppatori di applicazioni e specialisti della sicurezza IT. Si presume che tu abbia familiarità con Amazon Redshift.

Tipi di dati

Questa sezione mostra gli equivalenti tra i tipi di dati in Amazon Redshift e in BigQuery.

Amazon Redshift		BigQuery	Note
Tipo di dati	Alias	Tipo di dati
`SMALLINT`	`INT2`	`INT64`	`SMALLINT` di Amazon Redshift è di 2 byte, mentre `INT64` di BigQuery è di 8 byte.
`INTEGER`	`INT, INT4`	`INT64`	`INTEGER` di Amazon Redshift è di 4 byte, mentre `INT64` di BigQuery è di 8 byte.
`BIGINT`	`INT8`	`INT64`	Sia `BIGINT` di Amazon Redshift che `INT64` di BigQuery sono di 8 byte.
`DECIMAL`	`NUMERIC`	`NUMERIC`
`REAL`	`FLOAT4`	`FLOAT64`	`REAL` di Amazon Redshift è di 4 byte, mentre `FLOAT64` di BigQuery è di 8 byte.
`DOUBLE PRECISION`	`FLOAT8, FLOAT`	`FLOAT64`
`BOOLEAN`	`BOOL`	`BOOL`	`BOOLEAN` di Amazon Redshift può utilizzare `TRUE`, `t`, `true`, `y`, `yes` e `1` come valori letterali validi per true. Il tipo di dati `BOOL` di BigQuery utilizza `TRUE` senza distinzione tra maiuscole e minuscole.
`CHAR`	`CHARACTER, NCHAR, BPCHAR`	`STRING`
`VARCHAR`	`CHARACTER VARYING, NVARCHAR, TEXT`	`STRING`
`DATE`		`DATE`
`TIMESTAMP`	`TIMESTAMP WITHOUT TIME ZONE`	`DATETIME`
`TIMESTAMPTZ`	`TIMESTAMP WITH TIME ZONE`	`TIMESTAMP`	Nota: in BigQuery, i fusi orari vengono utilizzati durante l'analisi dei timestamp o la formattazione dei timestamp per la visualizzazione. Un timestamp formattato come stringa potrebbe includere un fuso orario, ma quando BigQuery analizza la stringa, archivia il timestamp nell'ora UTC equivalente. Quando un fuso orario non è specificato in modo esplicito, viene utilizzato il fuso orario predefinito, UTC. Sono supportati i nomi dei fusi orari o la differenza rispetto all'orario UTC utilizzando (-\|+)HH:MM, ma non le abbreviazioni dei fusi orari come PDT.
`GEOMETRY`		`GEOGRAPHY`	Supporto per l'esecuzione di query sui dati geospaziali.

BigQuery dispone anche dei seguenti tipi di dati che non hanno un analogo diretto in Amazon Redshift:

Tipi di conversione impliciti

Quando esegui la migrazione a BigQuery, devi convertire la maggior parte delle conversioni implicite di Amazon Redshift in conversioni esplicite di BigQuery, ad eccezione dei seguenti tipi di dati, che BigQuery converte implicitamente.

BigQuery esegue conversioni implicite per i seguenti tipi di dati:

Dal tipo BigQuery	To BigQuery type
`INT64`	`FLOAT64`
`INT64`	`NUMERIC`
`NUMERIC`	`FLOAT64`

BigQuery esegue anche conversioni implicite per i seguenti valori letterali:

Dal tipo BigQuery	To BigQuery type
Valore letterale `STRING` (ad es. "2008-12-25")	`DATE`
Valore letterale `STRING` (ad es. "2008-12-25 15:30:00")	`TIMESTAMP`
`STRING` valore letterale (ad es. "2008-12-25T07:30:00")	`DATETIME`
`STRING` letterale (ad es. "15:30:00")	`TIME`

Tipi di conversione espliciti

Puoi convertire i tipi di dati Amazon Redshift che BigQuery non converte implicitamente utilizzando la funzione CAST(expression AS type) di BigQuery o una delle funzioni di conversione DATE e TIMESTAMP.

Quando esegui la migrazione delle query, modifica tutte le occorrenze della funzione Amazon Redshift CONVERT(type, expression) (o della sintassi ::) con la funzione CAST(expression AS type) di BigQuery, come mostrato nella tabella della sezione Funzioni di formattazione dei tipi di dati.

Sintassi delle query

Questa sezione illustra le differenze nella sintassi delle query tra Amazon Redshift e BigQuery.

`SELECT` estratto conto

La maggior parte delle istruzioni Amazon Redshift SELECT è compatibile con BigQuery. La tabella seguente contiene un elenco di differenze minori.

Amazon Redshift	BigQuery
`SELECT TOP number expression FROM table`	`SELECT expression FROM table ORDER BY expression DESC LIMIT number`
`SELECT x/total AS probability, ROUND(100 * probability, 1) AS pct FROM raw_data` Nota: Redshift supporta la creazione e il riferimento a un alias nella stessa istruzione `SELECT`.	`SELECT x/total AS probability, ROUND(100 * (x/total), 1) AS pct FROM raw_data`

BigQuery supporta anche le seguenti espressioni nelle istruzioni SELECT, che non hanno un equivalente Amazon Redshift:

`FROM` clausola

Una clausola FROM in una query elenca i riferimenti alla tabella da cui vengono selezionati i dati. In Amazon Redshift, i possibili riferimenti alle tabelle includono tabelle, viste e sottoquery. Tutti questi riferimenti alle tabelle sono supportati in BigQuery.

È possibile fare riferimento alle tabelle BigQuery nella clausola FROM utilizzando quanto segue:

[project_id].[dataset_id].[table_name]
[dataset_id].[table_name]
[table_name]

BigQuery supporta anche ulteriori riferimenti alle tabelle:

Versioni storiche della definizione e delle righe della tabella utilizzando FOR SYSTEM_TIME AS OF.
Percorsi dei campi o qualsiasi percorso che si risolve in un campo all'interno di un tipo di dati (ad esempio un STRUCT).
Array appiattiti.

Tipi di `JOIN`

Sia Amazon Redshift che BigQuery supportano i seguenti tipi di join:

[INNER] JOIN
LEFT [OUTER] JOIN
RIGHT [OUTER] JOIN
FULL [OUTER] JOIN
CROSS JOIN e il cross join implicito con virgola equivalente.

La tabella seguente contiene un elenco di differenze minori.

Amazon Redshift	BigQuery
`SELECT col FROM table1 NATURAL INNER JOIN table2`	`SELECT col1 FROM table1 INNER JOIN table2 USING (col1, col2 [, ...])` Nota: in BigQuery, le clausole `JOIN` richiedono una condizione `JOIN`, a meno che la clausola non sia `CROSS JOIN` o una delle tabelle unite non sia un campo all'interno di un tipo di dati o di un array.

`WITH` clausola

Una clausola WITH BigQuery contiene una o più sottoquery denominate che vengono eseguite quando un'istruzione SELECT successiva fa riferimento a queste sottoquery. Le clausole Amazon Redshift WITH si comportano come quelle di BigQuery, con l'eccezione che puoi valutare la clausola una sola volta e riutilizzare i risultati.

Operatori Set

Esistono alcune piccole differenze tra gli operatori di insieme di Amazon Redshift e gli operatori di insieme di BigQuery . Tuttavia, tutte le operazioni sugli insiemi fattibili in Amazon Redshift sono replicabili in BigQuery.

Amazon Redshift	BigQuery
`SELECT * FROM table1 UNION SELECT * FROM table2`	`SELECT * FROM table1 UNION DISTINCT SELECT * FROM table2` Nota: BigQuery e Amazon Redshift supportano l'operatore `UNION ALL`.
`SELECT * FROM table1 INTERSECT SELECT * FROM table2`	`SELECT * FROM table1 INTERSECT DISTINCT SELECT * FROM table2`
`SELECT * FROM table1 EXCEPT SELECT * FROM table2`	`SELECT * FROM table1 EXCEPT DISTINCT SELECT * FROM table2`
`SELECT * FROM table1 MINUS SELECT * FROM table2`	`SELECT * FROM table1 EXCEPT DISTINCT SELECT * FROM table2`
`SELECT * FROM table1 UNION SELECT * FROM table2 EXCEPT SELECT * FROM table3`	`SELECT * FROM table1 UNION ALL ( SELECT * FROM table2 EXCEPT SELECT * FROM table3 )` Nota: BigQuery richiede le parentesi per separare le diverse operazioni sui set. Se lo stesso operatore di insieme viene ripetuto, le parentesi non sono necessarie.

`ORDER BY` clausola

Esistono alcune piccole differenze tra le clausole ORDER BY di Amazon Redshift e le clausole ORDER BY di BigQuery.

Amazon Redshift	BigQuery
In Amazon Redshift, i `NULL` vengono classificati per ultimi per impostazione predefinita (ordine crescente).	In BigQuery, i `NULL` vengono classificati per primi per impostazione predefinita (ordine crescente).
`SELECT * FROM table ORDER BY expression LIMIT ALL`	`SELECT * FROM table ORDER BY expression` Nota: BigQuery non utilizza la sintassi `LIMIT ALL`, ma `ORDER BY` ordina tutte le righe per impostazione predefinita, ottenendo lo stesso comportamento della clausola `LIMIT ALL` di Amazon Redshift. Ti consigliamo vivamente di includere una clausola `LIMIT` con ogni clausola `ORDER BY`. L'ordinamento di tutte le righe dei risultati senza necessità peggiora le prestazioni di esecuzione della query.
`SELECT * FROM table ORDER BY expression OFFSET 10`	`SELECT * FROM table ORDER BY expression LIMIT count OFFSET 10` Nota: in BigQuery, `OFFSET` deve essere utilizzato insieme a un `LIMIT` conteggio. Assicurati di impostare il valore count `INT64` sul numero minimo di righe ordinate necessarie. L'ordinamento di tutte le righe dei risultati riduce inutilmente le prestazioni di esecuzione delle query.

Condizioni

La seguente tabella mostra le condizioni Amazon Redshift, o predicati, specifici di Amazon Redshift e che devono essere convertiti nel loro equivalente BigQuery.

Amazon Redshift	BigQuery
`a = ANY (subquery)` `a = SOME (subquery)`	`a IN subquery`
`a <> ALL (subquery)` `a != ALL (subquery)`	`a NOT IN subquery`
`a IS UNKNOWN` `expression ILIKE pattern`	`a IS NULL` `LOWER(expression) LIKE LOWER(pattern)`
`expression LIKE pattern ESCAPE 'escape_char'`	`expression LIKE pattern` Nota: BigQuery non supporta i caratteri di escape personalizzati. Devi utilizzare due barre rovesciate \\ come caratteri di escape per BigQuery.
`expression [NOT] SIMILAR TO pattern`	`IF( LENGTH( REGEXP_REPLACE( expression, pattern, '' ) = 0, True, False )` Nota: se è specificato `NOT`, racchiudi l'espressione `IF` precedente in un'espressione `NOT` come mostrato di seguito: `NOT( IF( LENGTH(... )`
`expression [!] ~ pattern`	`[NOT] REGEXP_CONTAINS( expression, regex )`

Funzioni

Le sezioni seguenti elencano le funzioni di Amazon Redshift e le relative funzioni equivalenti di BigQuery.

Funzioni di aggregazione

La tabella seguente mostra i mapping tra le funzioni di aggregazione, aggregazione analitica e aggregazione approssimativa comuni di Amazon Redshift e le loro equivalenti BigQuery.

Amazon Redshift	BigQuery
`APPROXIMATE COUNT(DISTINCT expression)`	`APPROX_COUNT_DISTINCT(expression)`
`APPROXIMATE PERCENTILE_DISC( percentile ) WITHIN GROUP (ORDER BY expression)`	`APPROX_QUANTILES(expression, 100) [OFFSET(CAST(TRUNC(percentile * 100) as INT64))]`
`AVG([DISTINCT] expression)`	`AVG([DISTINCT] expression)`
`COUNT(expression)`	`COUNT(expression)`
`LISTAGG( [DISTINCT] aggregate_expression [, delimiter] ) [WITHIN GROUP (ORDER BY order_list)]`	`STRING_AGG( [DISTINCT] aggregate_expression [, delimiter] [ORDER BY order_list] )`
`MAX(expression)`	`MAX(expression)`
`MEDIAN(median_expression)`	`PERCENTILE_CONT( median_expression, 0.5 ) OVER()`
`MIN(expression)`	`MIN(expression)`
`PERCENTILE_CONT( percentile ) WITHIN GROUP (ORDER BY expression)`	`PERCENTILE_CONT( median_expression, percentile ) OVER()` Nota: non copre i casi d'uso di aggregazione.
`STDDEV([DISTINCT] expression)`	`STDDEV([DISTINCT] expression)`
`STDDEV_SAMP([DISTINCT] expression)`	`STDDEV_SAMP([DISTINCT] expression)`
`STDDEV_POP([DISTINCT] expression)`	`STDDEV_POP([DISTINCT] expression)`
`SUM([DISTINCT] expression)`	`SUM([DISTINCT] expression)`
`VARIANCE([DISTINCT] expression)`	`VARIANCE([DISTINCT] expression)`
`VAR_SAMP([DISTINCT] expression)`	`VAR_SAMP([DISTINCT] expression)`
`VAR_POP([DISTINCT] expression)`	`VAR_POP([DISTINCT] expression)`

BigQuery offre anche le seguenti funzioni aggregate, aggregate analytic e approximate aggregate, che non hanno un analogo diretto in Amazon Redshift:

Funzioni di aggregazione bit a bit

La tabella seguente mostra i mapping tra le funzioni di aggregazione bitwise comuni di Amazon Redshift e le relative funzioni equivalenti di BigQuery.

Amazon Redshift	BigQuery
`BIT_AND(expression)`	`BIT_AND(expression)`
`BIT_OR(expression)`	`BIT_OR(expression)`
`BOOL_AND>(expression)`	`LOGICAL_AND(expression)`
`BOOL_OR(expression)`	`LOGICAL_OR(expression)`

BigQuery offre anche la seguente funzione di aggregazione bit a bit, che non ha un analogo diretto in Amazon Redshift:

BIT_XOR

Funzioni finestra

La tabella seguente mostra i mapping tra le funzioni finestra comuni di Amazon Redshift e i relativi equivalenti BigQuery. Le funzioni finestra in BigQuery includono funzioni di aggregazione analitica, funzioni di aggregazione, funzioni di navigazione e funzioni di numerazione.

Espressioni condizionali

La tabella seguente mostra i mapping tra le espressioni condizionali Amazon Redshift comuni e i relativi equivalenti BigQuery.

Amazon Redshift	BigQuery
`CASEexpression WHEN value THEN result [WHEN...] [ELSE else_result] END`	`CASE expression WHEN value THEN result [WHEN...] [ELSE else_result] END`
`COALESCE(expression1[, ...])`	`COALESCE(expression1[, ...])`
`DECODE( expression, search1, result1 [, search2, result2...] [, default] )`	`CASE expression WHEN value1 THEN result1 [WHEN value2 THEN result2] [ELSE default] END`
`GREATEST(value [, ...])`	`GREATEST(value [, ...])`
`LEAST(value [, ...])`	`LEAST(value [, ...])`
`NVL(expression1[, ...])`	`COALESCE(expression1[, ...])`
`NVL2( expression, not_null_return_value, null_return_value )`	`IF( expression IS NULL, null_return_value, not_null_return_value )`
`NULLIF(expression1, expression2)`	`NULLIF(expression1, expression2)`

BigQuery offre anche le seguenti espressioni condizionali, che non hanno un analogo diretto in Amazon Redshift:

Funzioni di data e ora

La tabella seguente mostra i mapping tra le funzioni di data e ora comuni di Amazon Redshift e i relativi equivalenti BigQuery. Le funzioni di data e ora di BigQuery includono funzioni di data, funzioni di data e ora, funzioni di ora e funzioni di timestamp.

Tieni presente che le funzioni che sembrano identiche in Amazon Redshift e BigQuery potrebbero restituire tipi di dati diversi.

Amazon Redshift	BigQuery
`ADD_MONTHS( date, integer )`	`CAST( DATE_ADD( date, INTERVAL integer MONTH ) AS TIMESTAMP )`
timestamptz_or_timestamp `AT TIME ZONE timezone`	`PARSE_TIMESTAMP( "%c%z", FORMAT_TIMESTAMP( "%c%z", timestamptz_or_timestamp, timezone ) )` Nota: i fusi orari vengono utilizzati durante l'analisi dei timestamp o la formattazione dei timestamp per la visualizzazione. Un timestamp formattato come stringa potrebbe includere un fuso orario, ma quando BigQuery analizza la stringa, archivia il timestamp nell'ora UTC equivalente. Quando un fuso orario non è specificato in modo esplicito, viene utilizzato il fuso orario predefinito, UTC. Sono supportati i nomi dei fusi orari o la differenza rispetto all'UTC (-HH:MM), ma non le abbreviazioni dei fusi orari (ad esempio PDT).
`CONVERT_TIMEZONE( [source_timezone], target_timezone, timestamp )`	`PARSE_TIMESTAMP( "%c%z", FORMAT_TIMESTAMP( "%c%z", timestamp, target_timezone ) )` Nota: `source_timezone` è UTC in BigQuery.
`CURRENT_DATE` Nota: restituisce la data di inizio della transazione corrente nel fuso orario della sessione corrente (UTC per impostazione predefinita).	`CURRENT_DATE()` Nota: restituisce la data di inizio del prospetto attuale nel fuso orario UTC.
`DATE_CMP(date1, date2)`	`CASE WHEN date1 = date2 THEN 0 WHEN date1 > date2 THEN 1 ELSE -1 END`
`DATE_CMP_TIMESTAMP(date1, date2)`	`CASE WHEN date1 = CAST(date2 AS DATE) THEN 0 WHEN date1 > CAST(date2 AS DATE) THEN 1 ELSE -1 END`
`DATE_CMP_TIMESTAMPTZ(date, timestamptz)`	`CASE WHEN date > DATE(timestamptz) THEN 1 WHEN date < DATE(timestamptz) THEN -1 ELSE 0 END`
`DATE_PART_YEAR(date)`	`EXTRACT(YEAR FROM date)`
`DATEADD(date_part, interval, date)`	`CAST( DATE_ADD( date, INTERVAL interval datepart ) AS TIMESTAMP )`
`DATEDIFF( date_part, date_expression1, date_expression2 )`	`DATE_DIFF( date_expression1, date_expression2, date_part )`
`DATE_PART(date_part, date)`	`EXTRACT(date_part FROM date)`
`DATE_TRUNC('date_part', timestamp)`	`TIMESTAMP_TRUNC(timestamp, date_part)`
`EXTRACT(date_part FROM timestamp)`	`EXTRACT(date_part FROM timestamp)`
`GETDATE()`	`PARSE_TIMESTAMP( "%c", FORMAT_TIMESTAMP( "%c", CURRENT_TIMESTAMP() ) )`
`INTERVAL_CMP( interval_literal1, interval_literal2 )`	Per gli intervalli in Redshift, un anno è composto da 360 giorni. In BigQuery, puoi utilizzare la seguente funzione definita dall'utente (UDF) per analizzare un intervallo Redshift e tradurlo in secondi. CREATE TEMP FUNCTION parse_interval(interval_literal STRING) AS ( (select sum(case when unit in ('minutes', 'minute', 'm' ) then num * 60 when unit in ('hours', 'hour', 'h') then num * 60 * 60 when unit in ('days', 'day', 'd' ) then num * 60 * 60 * 24 when unit in ('weeks', 'week', 'w') then num * 60 * 60 * 24 * 7 when unit in ('months', 'month' ) then num * 60 * 60 * 24 * 30 when unit in ('years', 'year') then num * 60 * 60 * 24 * 360 else num end) from ( select cast(regexp_extract(value, r'^[0-9]\.?[0-9]+') as numeric) num, substr(value, length(regexp_extract(value, r'^[0-9]\.?[0-9]+')) + 1) unit from UNNEST( SPLIT( replace( interval_literal, ' ', ''), ',')) value ))); Per confrontare i valori letterali di intervallo, esegui: `IF( parse_interval(interval_literal1) > parse_interval(interval_literal2), 1, IF( parse_interval(interval_literal1) > parse_interval(interval_literal2), -1, 0 ) )`
`LAST_DAY(date)`	`DATE_SUB( DATE_ADD( date, INTERVAL 1 MONTH ), INTERVAL 1 DAY )`
`MONTHS_BETWEEN( date1, date2 )`	`DATE_DIFF( date1, date2, MONTH )`
`NEXT_DAY(date, day)`	`DATE_ADD( DATE_TRUNC( date, WEEK(day) ), INTERVAL 1 WEEK )`
`SYSDATE` Nota: restituisce il timestamp di inizio della transazione corrente nel fuso orario della sessione corrente (UTC per impostazione predefinita).	`CURRENT_TIMESTAMP()` Nota: restituisce il timestamp di inizio del rendiconto corrente nel fuso orario UTC.
`TIMEOFDAY()`	`FORMAT_TIMESTAMP( "%a %b %d %H:%M:%E6S %E4Y %Z", CURRENT_TIMESTAMP())`
`TIMESTAMP_CMP( timestamp1, timestamp2 )`	`CASE WHEN timestamp1 = timestamp2 THEN 0 WHEN timestamp1 > timestamp2 THEN 1 ELSE -1 END`
`TIMESTAMP_CMP_DATE( timestamp, date )`	`CASE WHEN EXTRACT( DATE FROM timestamp ) = date THEN 0 WHEN EXTRACT( DATE FROM timestamp) > date THEN 1 ELSE -1 END`
`TIMESTAMP_CMP_TIMESTAMPTZ( timestamp, timestamptz )` Nota: Redshift confronta i timestamp nel fuso orario definito dalla sessione utente. Il fuso orario predefinito della sessione utente è UTC.	`CASE WHEN timestamp = timestamptz THEN 0 WHEN timestamp > timestamptz THEN 1 ELSE -1 END` Nota: BigQuery confronta i timestamp nel fuso orario UTC.
`TIMESTAMPTZ_CMP( timestamptz1, timestamptz2 )` Nota: Redshift confronta i timestamp nel fuso orario definito dalla sessione utente. Il fuso orario predefinito della sessione utente è UTC.	`CASE WHEN timestamptz1 = timestamptz2 THEN 0 WHEN timestamptz1 > timestamptz2 THEN 1 ELSE -1 END` Nota: BigQuery confronta i timestamp nel fuso orario UTC.
`TIMESTAMPTZ_CMP_DATE( timestamptz, date )` Nota: Redshift confronta i timestamp nel fuso orario definito dalla sessione utente. Il fuso orario predefinito della sessione utente è UTC.	`CASE WHEN EXTRACT( DATE FROM timestamptz) = date THEN 0 WHEN EXTRACT( DATE FROM timestamptz) > date THEN 1 ELSE -1 END` Nota: BigQuery confronta i timestamp nel fuso orario UTC.
`TIMESTAMPTZ_CMP_TIMESTAMP( timestamptz, Timestamp )` Nota: Redshift confronta i timestamp nel fuso orario definito dalla sessione utente. Il fuso orario predefinito della sessione utente è UTC.	`CASE WHEN timestamp = timestamptz THEN 0 WHEN timestamp > timestamptz THEN 1 ELSE -1 END` Nota: BigQuery confronta i timestamp nel fuso orario UTC.
`TIMEZONE( timezone, Timestamptz_or_timestamp )`	`PARSE_TIMESTAMP( "%c%z", FORMAT_TIMESTAMP( "%c%z", timestamptz_or_timestamp, timezone ) )` Nota: i fusi orari vengono utilizzati durante l'analisi dei timestamp o la formattazione dei timestamp per la visualizzazione. Un timestamp formattato come stringa potrebbe includere un fuso orario, ma quando BigQuery analizza la stringa, archivia il timestamp nell'ora UTC equivalente. Quando un fuso orario non è specificato in modo esplicito, viene utilizzato il fuso orario predefinito, UTC. Sono supportati i nomi dei fusi orari o la differenza rispetto all'orario UTC (-HH:MM), ma non le abbreviazioni dei fusi orari (ad esempio PDT).
`TO_TIMESTAMP(timestamp, format)`	`PARSE_TIMESTAMP( format, FORMAT_TIMESTAMP( format, timestamp ) )` Nota: BigQuery segue un insieme diverso di elementi di formato. I fusi orari vengono utilizzati durante l'analisi dei timestamp o la formattazione dei timestamp per la visualizzazione. Un timestamp formattato come stringa potrebbe includere un fuso orario, ma quando BigQuery analizza la stringa, archivia il timestamp nell'ora UTC equivalente. Quando un fuso orario non è specificato in modo esplicito, viene utilizzato il fuso orario predefinito, UTC. I nomi dei fusi orari o l'offset da UTC (-HH:MM) sono supportati nella stringa di formato, ma le abbreviazioni dei fusi orari (ad esempio PDT) non sono supportate.
`TRUNC(timestamp)`	`CAST(timestamp AS DATE)`

BigQuery offre anche le seguenti funzioni di data e ora, che non hanno un analogo diretto in Amazon Redshift:

EXTRACT
DATE
DATE_SUB
DATE_ADD(restituisce il tipo di dati DATE)
DATE_FROM_UNIX_DATE
FORMAT_DATE
PARSE_DATE
UNIX_DATE
DATETIME
DATETIME_ADD
DATETIME_SUB
DATETIME_DIFF
DATETIME_TRUNC
FORMAT_DATETIME
PARSE_DATETIME
CURRENT_TIME
TIME
TIME_ADD
TIME_SUB
TIME_DIFF
TIME_TRUNC
FORMAT_TIME
PARSE_TIME
TIMESTAMP_SECONDS
TIMESTAMP_MILLIS
TIMESTAMP_MICROS
UNIX_SECONDS
UNIX_MILLIS
UNIX_MICROS

Operatori matematici

La tabella seguente mostra i mapping tra gli operatori matematici comuni di Amazon Redshift e i relativi equivalenti BigQuery.

Amazon Redshift	BigQuery
`X + Y`	`X + Y`
`X - Y`	`X - Y`
`X * Y`	`X * Y`
`X / Y` Nota: se l'operatore esegue la divisione intera (ovvero se `X` e `Y` sono entrambi numeri interi), viene restituito un numero intero. Se l'operatore esegue una divisione non intera, viene restituito un numero non intero.	Se la divisione intera: `CAST(FLOOR(X / Y) AS INT64)` Se la divisione non è intera: `CAST(X / Y AS INT64)` Nota: la divisione in BigQuery restituisce un numero non intero. Per evitare errori derivanti da un'operazione di divisione (errore di divisione per zero), utilizza `SAFE_DIVIDE(X, Y)` o `IEEE_DIVIDE(X, Y)`.
`X % Y`	`MOD(X, Y)` Nota: per evitare errori derivanti da un'operazione di divisione (errore di divisione per zero), utilizza `SAFE.MOD(X, Y)`. `SAFE.MOD(X, 0)` risultati in 0.
`X ^ Y`	`POW(X, Y)` `POWER(X, Y)` Nota: a differenza di Amazon Redshift, l'operatore `^` in BigQuery esegue l'operazione XOR bit a bit.
`\| / X`	`SQRT(X)` Nota: per evitare errori dovuti a un'operazione di radice quadrata (input negativo), utilizza `SAFE.SQRT(X)`. Input negativo con `SAFE.SQRT(X)` restituisce `NULL`.
`\|\| / X`	`SIGN(X) * POWER(ABS(X), 1/3)` Nota: `POWER(X, Y)` di BigQuery restituisce un errore se `X` è un valore finito minore di 0 e `Y` è un numero non intero.
`@ X`	`ABS(X)`
`X << Y`	`X << Y` Nota: questo operatore restituisce 0 o una sequenza di byte b'\x00' se il secondo operando `Y` è maggiore o uguale alla lunghezza in bit del primo operando `X` (ad esempio, 64 se `X` ha il tipo INT64). Questo operatore genera un errore se `Y` è negativo.
`X >> Y`	`X >> Y` Nota: sposta il primo operando `X` verso destra. Questo operatore non esegue l'estensione del bit di segno con un tipo firmato (riempie i bit vuoti a sinistra con 0). Questo operatore restituisce 0 o una sequenza di byte di b'\x00' se il secondo operando `Y` è maggiore o uguale alla lunghezza in bit del primo operando `X` (ad esempio, 64 se `X` ha il tipo INT64). Questo operatore genera un errore se `Y` è negativo.
`X & Y`	`X & Y`
`X \| Y`	`X \| Y`
`~X`	`~X`

BigQuery offre anche il seguente operatore matematico, che non ha un analogo diretto in Amazon Redshift:

X ^ Y (XOR bit a bit)

Funzioni matematiche

Amazon Redshift	BigQuery
`ABS(number)`	`ABS(number)`
`ACOS(number)`	`ACOS(number)`
`ASIN(number)`	`ASIN(number)`
`ATAN(number)`	`ATAN(number)`
`ATAN2(number1, number2)`	`ATAN2(number1, number2)`
`CBRT(number)`	`POWER(number, 1/3)`
`CEIL(number)`	`CEIL(number)`
`CEILING(number)`	`CEILING(number)`
`CHECKSUM(expression)`	`FARM_FINGERPRINT(expression)`
`COS(number)`	`COS(number)`
`COT(number)`	`1/TAN(number)`
`DEGREES(number)`	`number`*180/`ACOS(-1)`
`DEXP(number)`	`EXP(number)`
`DLOG1(number)`	`LN(number)`
`DLOG10(number)`	`LOG10(number)`
`EXP(number)`	`EXP(number)`
`FLOOR(number)`	`FLOOR(number)`
`LNnumber)`	`LN(number)`
`LOG(number)`	`LOG10(number)`
`MOD(number1, number2)`	`MOD(number1, number2)`
`PI`	`ACOS(-1)`
`POWER(expression1, expression2)`	`POWER(expression1, expression2)`
`RADIANS(number)`	`ACOS(-1)*(number/180)`
`RANDOM()`	`RAND()`
`ROUND(number [, integer])`	`ROUND(number [, integer])`
`SIN(number)`	`SIN(number)`
`SIGN(number)`	`SIGN(number)`
`SQRT(number)`	`SQRT(number)`
`TAN(number)`	`TAN(number)`
`TO_HEX(number)`	`FORMAT('%x', number)`
`TRUNC(number [, integer])+-+++`	`TRUNC(number [, integer])`

Funzioni di stringa

Amazon Redshift	BigQuery
string1 `\|\| string2`	`CONCAT(string1, string2)`
`BPCHARCMP(string1, string2)`	`CASE WHEN string1 = string2 THEN 0 WHEN string1 > string2 THEN 1 ELSE -1 END`
`BTRIM(string [, matching_string])`	`TRIM(string [, matching_string])`
`BTTEXT_PATTERN_CMP(string1, string2)`	`CASE WHEN string1 = string2 THEN 0 WHEN string1 > string2 THEN 1 ELSE -1 END`
`CHAR_LENGTH(expression)`	`CHAR_LENGTH(expression)`
`CHARACTER_LENGTH(expression)`	`CHARACTER_LENGTH(expression)`
`CHARINDEX(substring, string)`	`STRPOS(string, substring)`
`CHR(number)`	`CODE_POINTS_TO_STRING([number])`
`CONCAT(string1, string2)`	`CONCAT(string1, string2)` Nota: `CONCAT`(...) di BigQuery supporta la concatenazione di un numero qualsiasi di stringhe.
`CRC32`	Funzione definita dall'utente personalizzata
`FUNC_SHA1(string)`	`SHA1(string)`
`INITCAP`	`INITCAP`
`LEFT(string, integer)`	`SUBSTR(string, 0, integer)`
`RIGHT(string, integer)`	`SUBSTR(string, -integer)`
`LEN(expression)`	`LENGTH(expression)`
`LENGTH(expression)`	`LENGTH(expression)`
`LOWER(string)`	`LOWER(string)`
`LPAD(string1, length[, string2])`	`LPAD(string1, length[, string2])`
`RPAD(string1, length[, string2])`	`RPAD(string1, length[, string2])`
`LTRIM(string, trim_chars)`	`LTRIM(string, trim_chars)`
`MD5(string)`	`MD5(string)`
`OCTET_LENGTH(expression)`	`BYTE_LENGTH(expression)`
`POSITION(substring IN string)`	`STRPOS(string, substring)`
`QUOTE_IDENT(string)`	`CONCAT('"',string,'"')`
`QUOTE_LITERAL(string)`	`CONCAT("'",string,"'")`
`REGEXP_COUNT( source_string, pattern [,position] )`	`ARRAY_LENGTH( REGEXP_EXTRACT_ALL( source_string, pattern ) )` Se è specificato `position`: `ARRAY_LENGTH( REGEXP_EXTRACT_ALL( SUBSTR(source_string, IF(position <= 0, 1, position)), pattern ) )` Nota: BigQuery fornisce il supporto delle espressioni regolari utilizzando la libreria `re2`. Consulta la documentazione per la sintassi delle espressioni regolari.
`REGEXP_INSTR( source_string, pattern [,position [,occurrence]] )`	`IFNULL( STRPOS( source_string, REGEXP_EXTRACT( source_string, pattern) ),0)` Se viene specificato `source_string`: `REGEXP_REPLACE( source_string, pattern, replace_string )` Se viene specificato `position`: `IFNULL( STRPOS( SUBSTR(source_string, IF(position <= 0, 1, position)), REGEXP_EXTRACT( SUBSTR(source_string, IF(position <= 0, 1, position)), pattern) ) + IF(position <= 0, 1, position) - 1, 0)` Se viene specificato `occurrence`: `IFNULL( STRPOS( SUBSTR(source_string, IF(position <= 0, 1, position)), REGEXP_EXTRACT_ALL( SUBSTR(source_string, IF(position <= 0, 1, position)), pattern )[SAFE_ORDINAL(occurrence)] ) + IF(position <= 0, 1, position) - 1, 0)` Nota: BigQuery fornisce il supporto delle espressioni regolari utilizzando la libreria `re2`. Consulta la documentazione per la sintassi delle espressioni regolari.
`REGEXP_REPLACE( source_string, pattern [, replace_string [, position]] )`	`REGEXP_REPLACE( source_string, pattern, "" )` Se `source_string` è specificato: `REGEXP_REPLACE( source_string, pattern, replace_string )` Se `position` è specificato: `CASE WHEN position > LENGTH(source_string) THEN source_string WHEN position <= 0 THEN REGEXP_REPLACE( source_string, pattern, "" ) ELSE CONCAT( SUBSTR( source_string, 1, position - 1), REGEXP_REPLACE( SUBSTR(source_string, position), pattern, replace_string ) ) END`
`REGEXP_SUBSTR( source_string, pattern [, position [, occurrence]] )`	`REGEXP_EXTRACT( source_string, pattern )` Se è specificato `position`: `REGEXP_EXTRACT( SUBSTR(source_string, IF(position <= 0, 1, position)), pattern )` Se è specificato `occurrence`: `REGEXP_EXTRACT_ALL( SUBSTR(source_string, IF(position <= 0, 1, position)), pattern )[SAFE_ORDINAL(occurrence)]` Nota: BigQuery fornisce il supporto delle espressioni regolari utilizzando la libreria `re2`. Consulta la documentazione per la sintassi delle espressioni regolari.
`REPEAT(string, integer)`	`REPEAT(string, integer)`
`REPLACE(string, old_chars, new_chars)`	`REPLACE(string, old_chars, new_chars)`
`REPLICA(string, integer)`	`REPEAT(string, integer)`
`REVERSE(expression)`	`REVERSE(expression)`
`RTRIM(string, trim_chars)`	`RTRIM(string, trim_chars)`
`SPLIT_PART(string, delimiter, part)`	`SPLIT( string delimiter )SAFE_ORDINAL(part)`
`STRPOS(string, substring)`	`STRPOS(string, substring)`
`STRTOL(string, base)`
`SUBSTRING( string, start_position, number_characters )`	`SUBSTR( string, start_position, number_characters )`
`TEXTLEN(expression)`	`LENGTH(expression)`
`TRANSLATE( expression, characters_to_replace, characters_to_substitute )`	Può essere implementato utilizzando le funzioni definite dall'utente: CREATE TEMP FUNCTION translate(expression STRING, characters_to_replace STRING, characters_to_substitute STRING) AS ( IF(LENGTH(characters_to_replace) < LENGTH(characters_to_substitute) OR LENGTH(expression) < LENGTH(characters_to_replace), expression, (SELECT STRING_AGG( IFNULL( (SELECT ARRAY_CONCAT([c], SPLIT(characters_to_substitute, ''))[SAFE_OFFSET(( SELECT IFNULL(MIN(o2) + 1, 0) FROM UNNEST(SPLIT(characters_to_replace, '')) AS k WITH OFFSET o2 WHERE k = c))] ), ''), '' ORDER BY o1) FROM UNNEST(SPLIT(expression, '')) AS c WITH OFFSET o1 )) );
`TRIM([BOTH] string)`	`TRIM(string)`
`TRIM([BOTH] characters FROM string)`	`TRIM(string, characters)`
`UPPER(string)`	`UPPER(string)`

Funzioni di formattazione dei tipi di dati

Amazon Redshift	BigQuery
`CAST(expression AS type)`	`CAST(expression AS type)`
`expression :: type`	`CAST(expression AS type)`
`CONVERT(type, expression)`	`CAST(expression AS type)`
`TO_CHAR( timestamp_expression, format )`	`FORMAT_TIMESTAMP( format, timestamp_expression )` Nota: BigQuery e Amazon Redshift differiscono nel modo in cui specificare una stringa di formato per `timestamp_expression`.
`TO_CHAR( numeric_expression, format )`	`FORMAT( format, numeric_expression )` Nota: BigQuery e Amazon Redshift differiscono nel modo in cui specificare una stringa di formato per `timestamp_expression`.
`TO_DATE(date_string, format)`	`PARSE_DATE(date_string, format)` Nota: BigQuery e Amazon Redshift differiscono nel modo in cui specificare una stringa di formato per `date_string`.
`TO_NUMBER(string, format)`	`CAST( FORMAT( format, numeric_expression ) TO INT64 )` Nota: BigQuery e Amazon Redshift differiscono nel modo in cui specificare una stringa di formato numerico.

BigQuery supporta anche SAFE_CAST(expression AS typename), che restituisce NULL se BigQuery non è in grado di eseguire un cast. Ad esempio, SAFE_CAST("apple" AS INT64) restituisce NULL.

Sintassi DML

Questa sezione illustra le differenze nella sintassi del linguaggio di gestione dei dati tra Amazon Redshift e BigQuery.

`INSERT` estratto conto

Amazon Redshift offre una parola chiave DEFAULT configurabile per le colonne. In BigQuery, il valore DEFAULT per le colonne nullable è NULL, e DEFAULT non è supportato per le colonne obbligatorie. La maggior parte delle istruzioni Amazon Redshift INSERT sono compatibili con BigQuery. La tabella seguente mostra le eccezioni.

Amazon Redshift	BigQuery
`INSERT INTO table (column1 [, ...]) DEFAULT VALUES`	`INSERT [INTO] table (column1 [, ...]) VALUES (DEFAULT [, ...])`
`INSERT INTO table (column1, [,...]) VALUES ( SELECT ... FROM ... )`	`INSERT [INTO] table (column1, [,...]) SELECT ... FROM ...`

BigQuery supporta anche l'inserimento di valori utilizzando una sottoquery (in cui uno dei valori viene calcolato utilizzando una sottoquery), che non è supportato in Amazon Redshift. Ad esempio:

INSERT INTO table (column1, column2)
VALUES ('value_1', (
SELECT column2
FROM table2
))

`COPY` estratto conto

Il comando COPYdi Amazon Redshift carica i dati in una tabella da file di dati o da una tabella Amazon DynamoDB. BigQuery non utilizza il comando SQL COPY per caricare i dati, ma puoi utilizzare diversi strumenti e opzioni non SQL per caricare i dati nelle tabelle BigQuery. Puoi anche utilizzare i sink della pipeline di dati forniti in Apache Spark o Apache Beam per scrivere i dati in BigQuery.

`UPDATE` estratto conto

La maggior parte delle istruzioni UPDATE di Amazon Redshift è compatibile con BigQuery. La seguente tabella mostra le eccezioni.

Amazon Redshift	BigQuery
`UPDATE table SET column = expression [,...] [FROM ...]`	`UPDATE table SET column = expression [,...] [FROM ...] WHERE TRUE` Nota: tutte le istruzioni `UPDATE` in BigQuery richiedono una parola chiave `WHERE`, seguita da una condizione.
`UPDATE table SET column = DEFAULT [,...] [FROM ...] [WHERE ...]`	`UPDATE table SET column = NULL [, ...] [FROM ...] WHERE ...` Nota: il comando `UPDATE` di BigQuery non supporta i valori `DEFAULT`. Se l'istruzione `UPDATE` di Amazon Redshift non include una clausola `WHERE`, l'istruzione `UPDATE` di BigQuery deve essere condizionata `WHERE TRUE`.

Istruzioni `DELETE` e `TRUNCATE`

Le istruzioni DELETE e TRUNCATE sono due modi per rimuovere righe da una tabella senza influire sullo schema o sugli indici della tabella.

In Amazon Redshift, l'istruzione TRUNCATE è consigliata rispetto a un'istruzione DELETE non qualificata perché è più veloce e non richiede operazioni VACUUM e ANALYZE successive. Tuttavia, puoi utilizzare le istruzioni DELETE per ottenere lo stesso effetto.

In BigQuery, l'istruzione DELETE deve avere una clausola WHERE. Per ulteriori informazioni su DELETE in BigQuery, consulta gli esempi di DELETE di BigQuery nella documentazione DML.

Amazon Redshift	BigQuery
`DELETE [FROM] table_name` `TRUNCATE [TABLE] table_name`	`DELETE FROM table_name WHERE TRUE` Le istruzioni `DELETE` di BigQuery richiedono una clausola `WHERE`.
`DELETE FROM table_name USING other_table WHERE table_name.id=other_table.id`	`DELETE FROM table_name WHERE table_name.id IN ( SELECT id FROM other_table )` `DELETE FROM table_name WHERE EXISTS ( SELECT id FROM other_table WHERE table_name.id = other_table.id )` In Amazon Redshift, `USING` consente di fare riferimento ad altre tabelle nella clausola `WHERE`. Ciò può essere ottenuto in BigQuery utilizzando una sottoquery nella clausola `WHERE`.

`MERGE` estratto conto

L'istruzione MERGE può combinare le operazioni INSERT, UPDATE e DELETE in un'unica istruzione upsert ed eseguirle in modo atomico. L'operazione MERGE deve corrispondere al massimo a una riga di origine per ogni riga di destinazione.

Amazon Redshift non supporta un singolo comando MERGE. Tuttavia, un'operazione di unione può essere eseguita in Amazon Redshift eseguendo le operazioni INSERT, UPDATE e DELETE in una transazione.

Operazione di unione sostituendo le righe esistenti

In Amazon Redshift, l'override di tutte le colonne della tabella di destinazione può essere eseguito utilizzando un'istruzione DELETE e poi un'istruzione INSERT. L'istruzione DELETE rimuove le righe da aggiornare, mentre l'istruzione INSERT inserisce le righe aggiornate. Le tabelle BigQuery sono limitate a 1000 istruzioni DML al giorno, pertanto devi consolidare le istruzioni INSERT, UPDATE e DELETE in una singola istruzione MERGE, come mostrato nella tabella seguente.

Amazon Redshift	BigQuery
Consulta Eseguire un'operazione di unione sostituendo le righe esistenti. `CREATE TEMP TABLE temp_table; INSERT INTO temp_table SELECT * FROM source WHERE source.filter = 'filter_exp'; BEGIN TRANSACTION; DELETE FROM target USING temp_table WHERE target.key = temp_table.key; INSERT INTO target SELECT * FROM temp_table; END TRANSACTION; DROP TABLE temp_table;`	`MERGE target USING source ON target.key = source.key WHEN MATCHED AND source.filter = 'filter_exp' THEN UPDATE SET target.col1 = source.col1, target.col2 = source.col2, ...` Nota: se aggiorni tutte le colonne, devono essere elencate tutte.
Consulta Eseguire un'operazione di unione specificando un elenco di colonne. `CREATE TEMP TABLE temp_table; INSERT INTO temp_table SELECT * FROM source WHERE source.filter = 'filter_exp'; BEGIN TRANSACTION; UPDATE target SET col1 = temp_table.col1, col2 = temp_table.col2 FROM temp_table WHERE target.key=temp_table.key; INSERT INTO target SELECT * FROM`	`MERGE target USING source ON target.key = source.key WHEN MATCHED AND source.filter = 'filter_exp' THEN UPDATE SET target.col1 = source.col1, target.col2 = source.col2`

Sintassi DDL

Questa sezione illustra le differenze nella sintassi del linguaggio di definizione dei dati tra Amazon Redshift e BigQuery.

`SELECT INTO` estratto conto

In Amazon Redshift, l'istruzione SELECT INTO può essere utilizzata per inserire i risultati di una query in una nuova tabella, combinando la creazione e l'inserimento della tabella.

Amazon Redshift	BigQuery
`SELECT expression, ... INTO table FROM ...`	`INSERT table SELECT expression, ... FROM ...`
`WITH subquery_table AS ( SELECT ... ) SELECT expression, ... INTO table FROM subquery_table ...`	`INSERT table WITH subquery_table AS ( SELECT ... ) SELECT expression, ... FROM subquery_table ...`
`SELECT expression INTO TEMP table FROM ... SELECT expression INTO TEMPORARY table FROM ...`	BigQuery offre diversi modi per emulare le tabelle temporanee. Per saperne di più, consulta la sezione Tabelle temporanee.

`CREATE TABLE` estratto conto

La maggior parte delle istruzioni Amazon Redshift CREATE TABLE sono compatibili con BigQuery, ad eccezione dei seguenti elementi di sintassi, che non vengono utilizzati in BigQuery:

Amazon Redshift	BigQuery
`CREATE TABLE table_name ( col1 data_type1 NOT NULL, col2 data_type2 NULL, col3 data_type3 UNIQUE, col4 data_type4 PRIMARY KEY, col5 data_type5 )` Nota: i vincoli `UNIQUE` e `PRIMARY KEY` sono informativi e non sono applicati dal sistema Amazon Redshift.	`CREATE TABLE table_name ( col1 data_type1 NOT NULL, col2 data_type2, col3 data_type3, col4 data_type4, col5 data_type5, )`
`CREATE TABLE table_name ( col1 data_type1[,...] table_constraints ) where table_constraints are: [UNIQUE(column_name [, ... ])] [PRIMARY KEY(column_name [, ...])] [FOREIGN KEY(column_name [, ...]) REFERENCES reftable [(refcolumn)]` Nota: i vincoli `UNIQUE` e `PRIMARY KEY` sono informativi e non vengono applicati dal sistema Amazon Redshift.	`CREATE TABLE table_name ( col1 data_type1[,...] ) PARTITION BY column_name CLUSTER BY column_name [, ...]` Nota: BigQuery non utilizza i vincoli di tabella `UNIQUE`, `PRIMARY KEY` o `FOREIGN KEY`. Per ottenere un'ottimizzazione simile a quella fornita da questi vincoli durante l'esecuzione delle query, partiziona e raggruppa le tabelle BigQuery. `CLUSTER BY` supporta fino a 4 colonne.
`CREATE TABLE table_name LIKE original_table_name`	Fai riferimento a questo esempio per scoprire come utilizzare le tabelle `INFORMATION_SCHEMA` per copiare nomi di colonne, tipi di dati e vincoli `NOT NULL` in una nuova tabella.
`CREATE TABLE table_name ( col1 data_type1 ) BACKUP NO` Nota: in Amazon Redshift, l'impostazione `BACKUP NO` viene specificata per risparmiare tempo di elaborazione e ridurre lo spazio di archiviazione.	L'opzione della tabella `BACKUP NO` non viene utilizzata o non è necessaria perché BigQuery conserva automaticamente fino a 7 giorni di versioni storiche di tutte le tue tabelle senza influire sul tempo di elaborazione o sullo spazio di archiviazione fatturato.
`CREATE TABLE table_name ( col1 data_type1 ) table_attributes where table_attributes are: [DISTSTYLE {AUTO\|EVEN\|KEY\|ALL}] [DISTKEY (column_name)] [[COMPOUND\|INTERLEAVED] SORTKEY (column_name [, ...])]`	BigQuery supporta il clustering, che consente di archiviare le chiavi in ordine ordinato.
`CREATE TABLE table_name AS SELECT ...`	`CREATE TABLE table_name AS SELECT ...`
`CREATE TABLE IF NOT EXISTS table_name ...`	`CREATE TABLE IF NOT EXISTS table_name ...`

BigQuery supporta anche l'istruzione DDL CREATE OR REPLACE TABLE, che sovrascrive una tabella se esiste già.

L'istruzione CREATE TABLE di BigQuery supporta anche le seguenti clausole, che non hanno un equivalente Amazon Redshift:

Per ulteriori informazioni su CREATE TABLE in BigQuery, consulta gli CREATE TABLE esempi di BigQuery nella documentazione DML.

Tabelle temporanee

Amazon Redshift supporta le tabelle temporanee, che sono visibili solo all'interno della sessione corrente. Esistono diversi modi per emulare le tabelle temporanee in BigQuery:

TTL del set di dati: crea un set di dati con una durata breve (ad esempio, un'ora) in modo che tutte le tabelle create nel set di dati siano effettivamente temporanee perché non verranno mantenute più a lungo della durata del set di dati. Puoi aggiungere il prefisso temp a tutti i nomi delle tabelle in questo set di dati per indicare chiaramente che le tabelle sono temporanee.

TTL tabella: crea una tabella con un breve time to live specifico per la tabella utilizzando istruzioni DDL simili alla seguente:

CREATE TABLE
temp.name (col1, col2, ...)
OPTIONS (expiration_timestamp=TIMESTAMP_ADD(CURRENT_TIMESTAMP(),
INTERVAL 1 HOUR));

`CREATE VIEW` estratto conto

La tabella seguente mostra gli equivalenti tra Amazon Redshift e BigQuery per l'istruzione CREATE VIEW.

Amazon Redshift	BigQuery
`CREATE VIEW view_name AS SELECT ...`code>	`CREATE VIEW view_name AS SELECT ...`
`CREATE OR REPLACE VIEW view_name AS SELECT ...`	`CREATE OR REPLACE VIEW view_name AS SELECT ...`
`CREATE VIEW view_name (column_name, ...) AS SELECT ...`	`CREATE VIEW view_name AS SELECT ...`
Non supportati.	`CREATE VIEW IF NOT EXISTS c view_name OPTIONS(view_option_list) AS SELECT …` Crea una nuova vista solo se non esiste nel set di dati specificato.
`CREATE VIEW view_name AS SELECT ... WITH NO SCHEMA BINDING` In Amazon Redshift, è necessaria una vista con binding tardivo per fare riferimento a una tabella esterna.	In BigQuery, per creare una vista, tutti gli oggetti a cui viene fatto riferimento devono già esistere. BigQuery ti consente di eseguire query su origini dati esterne.

Funzioni definite dall'utente

Una funzione definita dall'utente consente di creare funzioni per operazioni personalizzate. Queste funzioni accettano colonne di input, eseguono azioni e restituiscono il risultato di queste azioni sotto forma di valore.

Sia Amazon Redshift che BigQuery supportano le funzioni definite dall'utente utilizzando espressioni SQL. Inoltre, in Amazon Redshift puoi creare una UDF basata su Python, mentre in BigQuery puoi creare una UDF basata su JavaScript.

Consulta il repository GitHub delle utilità BigQuery di Google Cloud per una libreria di UDF BigQuery comuni.

Sintassi di `CREATE FUNCTION`

La seguente tabella illustra le differenze nella sintassi di creazione delle UDF SQL tra Amazon Redshift e BigQuery.

Amazon Redshift	BigQuery
`CREATE [OR REPLACE] FUNCTION function_name ([sql_arg_name sql_arg_data_type[,..]]) RETURNS data_type IMMUTABLE AS $$ sql_function_definition $$ LANGUAGE sql`	`CREATE [OR REPLACE] FUNCTION function_name ([sql_arg_name sql_arg_data_type[,..]]) AS sql_function_definition` Nota: in una UDF SQL di BigQuery, un tipo di dati restituito è facoltativo. BigQuery deduce il tipo di risultato della funzione dal corpo della funzione SQL quando una query chiama la funzione.
`CREATE [OR REPLACE] FUNCTION function_name ([sql_arg_name sql_arg_data_type[,..]]) RETURNS data_type { VOLATILE \| STABLE \| IMMUTABLE } AS $$ sql_function_definition $$ LANGUAGE sql`	`CREATE [OR REPLACE] FUNCTION function_name ([sql_arg_name sql_arg_data_type[,..]]) RETURNS data_type AS sql_function_definition` Nota: la volatilità della funzione non è un parametro configurabile in BigQuery. Tutta la volatilità delle UDF BigQuery è equivalente alla volatilità `IMMUTABLE` di Amazon Redshift (ovvero non esegue ricerche nel database o utilizza in altro modo informazioni non direttamente presenti nell'elenco degli argomenti).
`CREATE [OR REPLACE] FUNCTION function_name ([sql_arg_name sql_arg_data_type[,..]]) RETURNS data_type IMMUTABLE AS $$ SELECT_clause $$ LANGUAGE sql` Nota: Amazon Redshift supporta solo una clausola `SQL SELECT` come definizione di funzione. Inoltre, la clausola `SELECT` non può includere nessuna delle clausole `FROM, INTO, WHERE, GROUP BY, ORDER BY,` e `LIMIT`.	`CREATE [OR REPLACE] FUNCTION function_name ([sql_arg_name sql_arg_data_type[,..]]) RETURNS data_type AS sql_expression` Nota: BigQuery supporta qualsiasi espressione SQL come definizione di funzione. Tuttavia, il riferimento a tabelle, viste o modelli non è supportato.
`CREATE [OR REPLACE] FUNCTION function_name ([sql_arg_name sql_arg_data_type[,..]]) RETURNS data_type IMMUTABLE AS $$ sql_function_definition $$ LANGUAGE sql`	`CREATE [OR REPLACE] FUNCTION function_name ([sql_arg_name sql_arg_data_type[,..]]) RETURNS data_type AS sql_function_definition` Nota: il valore letterale della lingua non deve essere specificato in una UDF GoogleSQL. BigQuery interpreta l'espressione SQL per impostazione predefinita. Inoltre, le virgolette del dollaro Amazon Redshift (`$$`) is not supported in BigQuery.
`CREATE [OR REPLACE] FUNCTION function_name (integer, integer) RETURNS integer IMMUTABLE AS $$ SELECT $1 + $2 $$ LANGUAGE sql`	`CREATE [OR REPLACE] FUNCTION function_name (x INT64, y INT64) RETURNS INT64 AS SELECT x + y` Note: BigQuery UDFs require all input arguments to be named. The Amazon Redshift argument variables (`$1`, `$2`, …) are not supported in BigQuery.
`CREATE [OR REPLACE] FUNCTION function_name (integer, integer) RETURNS integer IMMUTABLE AS $$ SELECT $1 + $2 $$ LANGUAGE sql` Note: Amazon Redshift does not support `ANY TYPE` for SQL UDFs. However, it supports using the `ANYELEMENT` data type in Python-based UDFs.	`CREATE [OR REPLACE] FUNCTION function_name (x ANY TYPE, y ANY TYPE) AS SELECT x + y` Note: BigQuery supports using `ANY TYPE` as argument type. The function accepts an input of any type for this argument. For more information, see templated parameter in BigQuery.

BigQuery also supports the CREATE FUNCTION IF NOT EXISTS statement, which treats the query as successful and takes no action if a function with the same name already exists.

BigQuery's CREATE FUNCTION statement also supports creating TEMPORARY or TEMP functions, which do not have an Amazon Redshift equivalent.

See calling UDFs for details on executing a BigQuery-persistent UDF.

`DROP FUNCTION` syntax

The following table addresses differences in DROP FUNCTION syntax between Amazon Redshift and BigQuery.

Amazon Redshift	BigQuery
`DROP FUNCTION function_name ( [arg_name] arg_type [, ...] ) [ CASCADE \| RESTRICT ]`	`DROP FUNCTION dataset_name.function_name` Note: BigQuery does not require using the function's signature for deleting the function. Also, removing function dependencies is not supported in BigQuery.

BigQuery also supports the DROP FUNCTION IF EXISTS statement, which deletes the function only if the function exists in the specified dataset.

BigQuery requires that you specify the project_name if the function is not located in the current project.

UDF components

This section highlights the similarities and differences in UDF components between Amazon Redshift andBigQuery.

Component	Amazon Redshift	BigQuery
Name	Amazon Redshift recommends using the prefix `_f` for function names to avoid conflicts with existing or future built-in SQL function names.	In BigQuery, you can use any custom function name.
Arguments	Arguments are optional. You can use name and data types for Python UDF arguments and only data types for SQL UDF arguments. In SQL UDFs, you must refer to arguments using `$1`, `$2`, and so on. Amazon Redshift also restricts the number of arguments to 32.	Arguments are optional, but if you specify arguments, they must use both name and data types for both JavaScript and SQL UDFs. The maximum number of arguments for a persistent UDF is 256.
Data type	Amazon Redshift supports a different set of data types for SQL and Python UDFs. For a Python UDF, the data type might also be `ANYELEMENT`. You must specify a `RETURN` data type for both SQL and Python UDFs. See Data types in this document for equivalents between data types in Amazon Redshift and in BigQuery.	BigQuery supports a different set of data types for SQL and JavaScript UDFs. For a SQL UDF, the data type might also be `ANY TYPE`. For more information, see templated parameters in BigQuery. The `RETURN` data type is optional for SQL UDFs. See Supported JavaScript UDF data types for information on how BigQuery data types map to JavaScript data types.
Definition	For both SQL and Python UDFs, you must enclose the function definition using dollar quoting, as in a pair of dollar signs (`$$`) per indicare l'inizio e la fine delle istruzioni della funzione. Per le UDF SQL,Amazon Redshift supporta solo una clausola `SELECT` SQL come definizione della funzione. Inoltre, la clausola `SELECT` non può includere nessuna delle clausole `FROM`, `INTO`, `WHERE`, `GROUP` `BY`, `ORDER BY` e `LIMIT`. Per le UDF Python, puoi scrivere un programma Python utilizzando la libreria standard Python 2.7 o importare i tuoi moduli personalizzati creandone uno utilizzando il comando `CREATE LIBRARY`.	In BigQuery, devi racchiudere il codice JavaScript tra virgolette. Per saperne di più, consulta le regole relative alle citazioni. Per le UDF SQL, puoi utilizzare qualsiasi espressione SQL come definizione della funzione. Tuttavia, BigQuery non supporta i riferimenti a tabelle, viste o modelli. Per le funzioni definite dall'utente JavaScript, puoi includere librerie di codice esterne direttamente utilizzando la sezione `OPTIONS` . Puoi anche utilizzare lo strumento di test delle UDF BigQuery per testare le tue funzioni.
Lingua	Devi utilizzare il valore letterale `LANGUAGE` per specificare la lingua come `sql` per le UDF SQL o `plpythonu` per le UDF Python.	Non è necessario specificare `LANGUAGE` per le UDF SQL, ma devi specificare la lingua come `js` per le UDF JavaScript.
Stato	Amazon Redshift non supporta la creazione di UDF temporanee. Amazon Redshift offre un'opzione per definire la volatilità di una funzione utilizzando i valori letterali `VOLATILE`, `STABLE` o `IMMUTABLE` . Viene utilizzato per l'ottimizzazione dello strumento di ottimizzazione delle query.	BigQuery supporta le UDF permanenti e temporanee. Puoi riutilizzare le funzioni definite dall'utente permanenti in più query, mentre puoi utilizzare le funzioni definite dall'utente temporanee solo in una singola query. La volatilità della funzione non è un parametro configurabile in BigQuery. Tutta la volatilità delle UDF BigQuery è equivalente alla volatilità `IMMUTABLE`di Amazon Redshift.
Sicurezza e privilegi	Per creare una UDF, devi disporre dell'autorizzazione per l'utilizzo del linguaggio per SQL o plpythonu (Python). Per impostazione predefinita, `USAGE ON LANGUAGE SQL` viene concesso a `PUBLIC`, ma devi concedere esplicitamente `USAGE ON LANGUAGE PLPYTHONU` a utenti o gruppi specifici. Inoltre, devi essere un superutente per sostituire una UDF.	La concessione di autorizzazioni esplicite per la creazione o l'eliminazione di qualsiasi tipo di UDF non è necessaria in BigQuery. Qualsiasi utente a cui è stato assegnato il ruolo Editor dati BigQuery (con `bigquery.routines.*` come una delle autorizzazioni) può creare o eliminare funzioni per il set di dati specificato. BigQuery supporta anche la creazione di ruoli personalizzati. Puoi gestire questa impostazione utilizzando Cloud IAM.
Limiti	Consulta la sezione Limiti delle UDF Python.	Consulta i limiti delle funzioni definite dall'utente.

Istruzioni SQL per metadati e transazioni

Amazon Redshift	BigQuery
`SELECT * FROM STL_ANALYZE WHERE name = 'T';`	Non utilizzato in BigQuery. Non è necessario raccogliere statistiche per migliorare le prestazioni delle query. Per ottenere informazioni sulla distribuzione dei dati, puoi utilizzare le funzioni di aggregazione approssimate.
`ANALYZE [[ table_name[(column_name [, ...])]]`	Non utilizzato in BigQuery.
`LOCK TABLE table_name;`	Non utilizzato in BigQuery.
`BEGIN TRANSACTION; SELECT ... END TRANSACTION;`	BigQuery utilizza l'isolamento degli snapshot. Per maggiori dettagli, vedi Garanzie di coerenza.
`EXPLAIN ...`	Non utilizzato in BigQuery. Funzionalità simili sono la spiegazione del piano di query nella console BigQuery Google Cloud e la registrazione di controllo in Cloud Monitoring.
`SELECT * FROM SVV_TABLE_INFO WHERE table = 'T';`	`SELECT * EXCEPT(is_typed) FROM mydataset.INFORMATION_SCHEMA.TABLES;` Per ulteriori informazioni, vedi Introduzione a BigQuery `INFORMATION_SCHEMA`.
`VACUUM [table_name]`	Non utilizzato in BigQuery. Le tabelle in cluster BigQuery vengono ordinate automaticamente.

Istruzioni SQL su più righe e con più istruzioni

Sia Amazon Redshift che BigQuery supportano le transazioni (sessioni) e quindi le istruzioni separate da punti e virgola che vengono eseguite in modo coerente insieme. Per maggiori informazioni, consulta la sezione Transazioni con più estratti conto.

Istruzioni SQL procedurali

`CREATE PROCEDURE` estratto conto

Amazon Redshift	BigQuery
`CREATE or REPLACE PROCEDURE`	`CREATE PROCEDURE` se è richiesto un nome. Altrimenti, usa l'opzione in linea con `BEGIN` o in una sola riga con `CREATE TEMP FUNCTION`.
`CALL`	`CALL`

Dichiarazione e assegnazione di variabili

Amazon Redshift	BigQuery
`DECLARE`	`DECLARE` Dichiara una variabile del tipo specificato.
`SET`	`SET` Imposta una variabile in modo che abbia il valore dell'espressione fornita oppure imposta più variabili contemporaneamente in base al risultato di più espressioni.

Gestori delle condizioni di errore

In Amazon Redshift, un errore riscontrato durante l'esecuzione di una stored procedure termina il flusso di esecuzione, la transazione e ne esegue il rollback. Questi risultati si verificano perché le sotto-transazioni non sono supportate. In una procedura archiviata Amazon Redshift, l'unico handler_statement supportato è RAISE. In BigQuery, la gestione degli errori è una funzionalità di base del flusso di controllo principale, simile a quella fornita da altri linguaggi con i blocchi TRY ... CATCH.

Amazon Redshift	BigQuery
`BEGIN ... EXCEPTION WHEN OTHERS THEN`	`BEGIN ... EXCEPTION WHEN ERROR THEN`
`RAISE`	`RAISE`
`[ <<label>> ] [ DECLARE declarations ] BEGIN statements EXCEPTION BEGIN statements EXCEPTION WHEN OTHERS THEN Handler_statements END;`	`BEGIN BEGIN ... EXCEPTION WHEN ERROR THEN SELECT 1/0; END; EXCEPTION WHEN ERROR THEN -- The exception thrown from the inner exception handler lands here. END;`

Dichiarazioni e operazioni del cursore

Poiché BigQuery non supporta i cursori o le sessioni, le seguenti istruzioni non vengono utilizzate in BigQuery:

DECLARE cursor_name CURSOR [FOR] ...
PREPARE plan_name [ (datatype [, ...] ) ] AS statement
OPEN cursor_name FOR SELECT ...
FETCH [ NEXT | ALL | {FORWARD [ count | ALL ] } ] FROM cursor_name
CLOSE cursor_name;

Se utilizzi il cursore per restituire un insieme di risultati, puoi ottenere un comportamento simile utilizzando le tabelle temporanee in BigQuery.

Istruzioni SQL dinamiche

La funzionalità di scripting in BigQuery supporta istruzioni SQL dinamiche come quelle mostrate nella tabella seguente.

Amazon Redshift	BigQuery
`EXECUTE`	`EXECUTE IMMEDIATE`

Istruzioni di flusso di controllo

Amazon Redshift	BigQuery
`IF..THEN..ELSIF..THEN..ELSE..END IF`	`IF condition THEN stmts ELSE stmts END IF`
`name CURSOR [ ( arguments ) ] FOR query`	I cursori o le sessioni non vengono utilizzati in BigQuery.
`[<>] LOOP statements END LOOP [ label ];`	`LOOP sql_statement_list END LOOP;`
`WHILE condition LOOP stmts END LOOP`	`WHILE condition DO stmts END WHILE`
`EXIT`	`BREAK`

Garanzie di coerenza e isolamento delle transazioni

Sia Amazon Redshift che BigQuery sono atomici, ovvero conformi ad ACID a livello di mutazione in molte righe.

Transazioni

Amazon Redshift supporta l'isolamento serializzabile per impostazione predefinita per le transazioni. Amazon Redshift ti consente di specificare uno qualsiasi dei quattro livelli di isolamento delle transazioni standard SQL, ma elabora tutti i livelli di isolamento come serializzabili.

BigQuery supporta anche le transazioni. BigQuery contribuisce a garantire il controllo della concorrenza ottimistico (la prima operazione di commit ha la priorità) con l'isolamento degli snapshot, in cui una query legge gli ultimi dati di cui è stato eseguito il commit prima dell'inizio della query. Questo approccio garantisce lo stesso livello di coerenza per riga, per mutazione e tra le righe all'interno della stessa istruzione DML, evitando al contempo i deadlock. In caso di più aggiornamenti DML sulla stessa tabella, BigQuery passa al controllo della concorrenza pessimistico. I job di caricamento possono essere eseguiti in modo completamente indipendente e aggiunti alle tabelle.

Esegui il rollback

Se Amazon Redshift rileva un errore durante l'esecuzione di una stored procedure, esegue il rollback di tutte le modifiche apportate in una transazione. Inoltre, puoi utilizzare l'istruzione di controllo delle transazioni ROLLBACK in una stored procedure per eliminare tutte le modifiche.

In BigQuery, puoi utilizzare l'istruzione ROLLBACK TRANSACTION.

Limiti per i database

Consulta la documentazione pubblica di BigQuery per le quote e i limiti più recenti. Molte quote per gli utenti con volumi elevati possono essere aumentate contattando il team di assistenza Cloud. La tabella seguente mostra un confronto tra i limiti dei database Amazon Redshift e BigQuery.

Limite	Amazon Redshift	BigQuery
Tabelle in ogni database per i tipi di nodi del cluster large e xlarge	9900	Senza restrizioni
Tabelle in ogni database per i tipi di nodi del cluster 8xlarge	20.000	Senza restrizioni
Database definiti dall'utente che puoi creare per ogni cluster	60	Senza restrizioni
Dimensione massima della riga	4 MB	100 MB