Guida alla traduzione SQL di Apache Hive
Questo documento descrive le somiglianze e le differenze nella sintassi SQL tra Apache Hive e BigQuery per aiutarti a pianificare migrazione. Per eseguire la migrazione collettiva degli script SQL, utilizza la traduzione SQL batch. Da tradurre per le query ad hoc, utilizza traduzione SQL interattiva.
In alcuni casi, non esiste una mappatura diretta tra un elemento SQL in Hive e BigQuery. Tuttavia, nella maggior parte dei casi, BigQuery offre un elemento alternativo Hive per aiutarti a ottenere le stesse funzionalità mostrati negli esempi di questo documento.
Il pubblico di destinazione di questo documento è costituito da architetti aziendali, amministratori di database, sviluppatori di applicazioni e specialisti della sicurezza IT. it presuppone che tu conosca Hive.
Tipi di dati
Hive e BigQuery hanno sistemi di tipi di dati diversi. Nella maggior parte dei casi, puoi mappare i tipi di dati in Hive ai tipi di dati BigQuery con alcune eccezioni, come MAP
e UNION
. Hive
supporta la trasmissione di tipi più impliciti rispetto a BigQuery. Di conseguenza,
il traduttore SQL batch inserisce molti cast espliciti.
Hive | BigQuery |
---|---|
TINYINT |
INT64 |
SMALLINT |
INT64 |
INT |
INT64 |
BIGINT |
INT64 |
DECIMAL |
NUMERIC |
FLOAT |
FLOAT64 |
DOUBLE |
FLOAT64 |
BOOLEAN |
BOOL |
STRING |
STRING |
VARCHAR |
STRING |
CHAR |
STRING |
BINARY |
BYTES |
DATE |
DATE |
- | DATETIME |
- | TIME |
TIMESTAMP |
DATETIME/TIMESTAMP |
INTERVAL |
- |
ARRAY |
ARRAY |
STRUCT |
STRUCT |
MAPS |
STRUCT con valori chiave (campo REPEAT ) |
UNION |
STRUCT con diversi tipi |
- | GEOGRAPHY |
- | JSON |
Sintassi delle query
Questa sezione illustra le differenze nella sintassi delle query tra Hive e BigQuery.
Istruzione SELECT
La maggior parte delle istruzioni SELECT
Hive è compatibile con BigQuery. La tabella seguente contiene un elenco
differenze minime:
Richiesta | Hive | BigQuery |
---|---|---|
Sottoquery |
|
|
Filtro delle colonne |
|
|
Espandere un array |
|
|
Clausola FROM
La clausola FROM
in una query elenca i riferimenti tabella da cui vengono generati
selezionato. In Hive, i possibili riferimenti alle tabelle includono tabelle, visualizzazioni e sottoquery. BigQuery supporta anche tutti questi riferimenti alle tabelle.
Puoi fare riferimento alle tabelle BigQuery nella clausola FROM
utilizzando
le seguenti:
[project_id].[dataset_id].[table_name]
[dataset_id].[table_name]
[table_name]
BigQuery supporta anche altri riferimenti a tabelle:
- Versioni storiche della definizione della tabella e delle righe che utilizzano
FOR SYSTEM_TIME AS OF
- Percorsi dei campi o qualsiasi percorso che risolve in un campo all'interno di un tipo di dati (ad esempio un
STRUCT
) - Array appiattiti
Operatori di confronto
La tabella seguente fornisce i dettagli sulla conversione degli operatori da Da Hive in BigQuery:
Funzione o operatore | Hive | BigQuery |
---|---|---|
- unaria meno * Moltiplicazione / divisione + Aggiunta - Sottrazione
|
Tutti i tipi di numeri | Tutti i tipi di numeri. Per evitare errori durante l'operazione di divisione, valuta la possibilità di utilizzare |
~ a livello di bit non | a livello di bit O & a bit e XOR a bit a livello di ^
|
Tipo di dati booleano | Tipo di dati booleano. |
Maiusc sinistro |
|
|
Maiusc a destra |
|
|
Modulo (resto) |
X % Y Tutti i tipi di numeri |
MOD(X, Y) |
Divisione di numeri interi | A DIV B e A/B per una precisione dettagliata |
Tutti i tipi di numeri. Nota: per evitare errori durante l'operazione di divisione, puoi utilizzare |
Negazione unaria | ! , NOT |
NOT |
Tipi che supportano i confronti di uguaglianza | Tutti i tipi primitivi | Tutti i tipi paragonabili e STRUCT .
|
a <=> b |
Non supportati. Traduci nel seguente modo:
|
|
a <> b |
Non supportati. Traduci nel seguente modo:
|
|
Operatori relazionali ( =, ==, !=, <, >, >= ) |
Tutti i tipi primitivi | Tutti i tipi paragonabili. |
Confronto stringhe | RLIKE , REGEXP
|
Funzione integrata REGEXP_CONTAINS . Utilizza la sintassi regex per le funzioni stringa di BigQuery per i pattern di espressioni regolari. |
[NOT] LIKE, [NOT] BETWEEN, IS [NOT] NULL |
A [NOT] BETWEEN B AND C, A IS [NOT] (TRUE|FALSE), A [NOT] LIKE B
|
Come per Hive. BigQuery supporta anche l'operatore IN . |
Condizioni JOIN
Sia Hive che BigQuery supportano i seguenti tipi di join:
[INNER] JOIN
LEFT [OUTER] JOIN
RIGHT [OUTER] JOIN
FULL [OUTER] JOIN
CROSS JOIN
e l'equivalente join con virgola implicito
Per ulteriori informazioni, vedi Operazione di join e Hive si unisce.
Tipo di conversione e trasmissione
La tabella seguente fornisce dettagli sulla conversione delle funzioni da Hive a BigQuery:
Funzione o operatore | Hive | BigQuery |
---|---|---|
Tipo di trasmissione | Quando una conversione non va a buon fine, viene restituito "NULL". | Stessa sintassi di Hive. Per saperne di più sulle regole di conversione per i tipi BigQuery, consulta Regole di conversione. Se la trasmissione non riesce, viene visualizzato un errore. Per avere lo stesso comportamento di Hive, utilizza |
Chiamate di funzione SAFE |
Se anteponi alle chiamate alle funzioni il prefisso SAFE , la funzione restituisce NULL anziché segnalare l'errore. Ad esempio, SAFE.SUBSTR('foo', 0, -2) AS safe_output; restituisce NULL .Nota: quando trasmetti in sicurezza senza errori, utilizza |
Tipi di conversione impliciti
Durante la migrazione a BigQuery, devi convertire la maggior parte delle conversioni implicite di Hive in conversioni esplicite di BigQuery, ad eccezione dei seguenti tipi di dati, che BigQuery converte in modo implicito.
Dal tipo BigQuery | Al tipo BigQuery |
---|---|
INT64 |
FLOAT64 , NUMERIC , BIGNUMERIC |
BIGNUMERIC |
FLOAT64 |
NUMERIC |
BIGNUMERIC , FLOAT64 |
BigQuery esegue anche conversioni implicite per i seguenti letterali:
Dal tipo BigQuery | Al tipo BigQuery |
---|---|
STRING letterale (ad esempio "2008-12-25" ) |
DATE |
STRING letterale (ad esempio "2008-12-25 15:30:00" ) |
TIMESTAMP |
STRING letterale (ad esempio "2008-12-25T07:30:00" ) |
DATETIME |
STRING letterale (ad esempio "15:30:00" ) |
TIME |
Tipi di conversione espliciti
Se vuoi convertire tipi di dati Hive non richiesti da BigQuery
convertire in modo implicito, utilizzare la funzione CAST(expression AS type)
di BigQuery o una delle funzioni di conversione DATE
e TIMESTAMP
.
Funzioni
Questa sezione illustra le funzioni comuni utilizzate in Hive e in BigQuery.
Funzioni di aggregazione
La seguente tabella mostra le mappature tra le funzioni di aggregazione, di aggregazione statistica e di approssimazione comuni di Hive con i relativi equivalenti di BigQuery:
Hive | BigQuery |
---|---|
count(DISTINCT expr[, expr...])
|
count(DISTINCT expr[, expr...])
|
percentile_approx(DOUBLE col, array(p1 [, p2]...) [, B]) WITHIN GROUP (ORDER BY expression)
|
APPROX_QUANTILES(expression, 100)[OFFSET(CAST(TRUNC(percentile * 100) as INT64))] BigQuery non supporta il resto degli argomenti definiti da Hive. |
AVG
|
AVG
|
X | Y
|
BIT_OR / X | Y
|
X ^ Y
|
BIT_XOR / X ^ Y
|
X & Y
|
BIT_AND / X & Y
|
COUNT
|
COUNT
|
COLLECT_SET(col), \
COLLECT_LIST(col )
|
ARRAY_AGG(col)
|
COUNT
|
COUNT
|
MAX
|
MAX
|
MIN
|
MIN
|
REGR_AVGX
|
AVG(
|
REGR_AVGY
|
AVG(
|
REGR_COUNT
|
SUM(
|
REGR_INTERCEPT
|
AVG(dep_var_expr)
|
REGR_R2
|
(COUNT(dep_var_expr) *
|
REGR_SLOPE
|
COVAR_SAMP(ind_var_expr,
|
REGR_SXX
|
SUM(POWER(ind_var_expr, 2)) - COUNT(ind_var_expr) * POWER(AVG(ind_var_expr),2)
|
REGR_SXY
|
SUM(ind_var_expr*dep_var_expr) - COUNT(ind_var_expr) * AVG(ind) * AVG(dep_var_expr)
|
REGR_SYY
|
SUM(POWER(dep_var_expr, 2)) - COUNT(dep_var_expr) * POWER(AVG(dep_var_expr),2)
|
ROLLUP
|
ROLLUP
|
STDDEV_POP
|
STDDEV_POP
|
STDDEV_SAMP
|
STDDEV_SAMP, STDDEV
|
SUM
|
SUM
|
VAR_POP
|
VAR_POP
|
VAR_SAMP
|
VAR_SAMP, VARIANCE
|
CONCAT_WS
|
STRING_AGG
|
Funzioni di analisi
La tabella seguente mostra le mappature tra le funzioni analitiche Hive comuni e i relativi equivalenti BigQuery:
Hive | BigQuery |
---|---|
AVG
|
AVG
|
COUNT
|
COUNT
|
COVAR_POP
|
COVAR_POP
|
COVAR_SAMP
|
COVAR_SAMP
|
CUME_DIST
|
CUME_DIST
|
DENSE_RANK
|
DENSE_RANK
|
FIRST_VALUE
|
FIRST_VALUE
|
LAST_VALUE
|
LAST_VALUE
|
LAG
|
LAG
|
LEAD
|
LEAD
|
COLLECT_LIST, \
COLLECT_SET
|
ARRAY_AGG
ARRAY_CONCAT_AGG
|
MAX
|
MAX
|
MIN
|
MIN
|
NTILE
|
NTILE(constant_integer_expression)
|
PERCENT_RANK
|
PERCENT_RANK
|
RANK ()
|
RANK
|
ROW_NUMBER
|
ROW_NUMBER
|
STDDEV_POP
|
STDDEV_POP
|
STDDEV_SAMP
|
STDDEV_SAMP, STDDEV
|
SUM
|
SUM
|
VAR_POP
|
VAR_POP
|
VAR_SAMP
|
VAR_SAMP, VARIANCE
|
VARIANCE
|
VARIANCE ()
|
WIDTH_BUCKET
|
È possibile utilizzare una funzione definita dall'utente. |
Funzioni di data e ora
La tabella seguente mostra le mappature tra Hive comune le funzioni di data e ora e i rispettivi equivalenti BigQuery:
DATE_ADD
|
DATE_ADD(date_expression, INTERVAL int64_expression date_part)
|
DATE_SUB
|
DATE_SUB(date_expression, INTERVAL int64_expression date_part)
|
CURRENT_DATE
|
CURRENT_DATE
|
CURRENT_TIME
|
CURRENT_TIME
|
CURRENT_TIMESTAMP
|
CURRENT_DATETIME
è consigliato, in quanto questo valore è senza fuso orario ed è sinonimo di
CURRENT_TIMESTAMP
CURRENT_TIMESTAMP
in Hive.
|
EXTRACT(field FROM source)
|
EXTRACT(part FROM datetime_expression)
|
LAST_DAY
|
DATE_SUB( DATE_TRUNC( DATE_ADD(
|
MONTHS_BETWEEN
|
DATE_DIFF(date_expression, date_expression, MONTH)
|
NEXT_DAY
|
DATE_ADD(
|
TO_DATE
|
PARSE_DATE
|
FROM_UNIXTIME
|
UNIX_SECONDS
|
FROM_UNIXTIMESTAMP
|
FORMAT_TIMESTAMP
|
YEAR \
QUARTER \
MONTH \
HOUR \
MINUTE \
SECOND \
WEEKOFYEAR
|
EXTRACT
|
DATEDIFF
|
DATE_DIFF
|
BigQuery offre le seguenti funzioni aggiuntive di data e ora:
Funzioni di stringa
La tabella seguente mostra le mappature tra le funzioni di stringa Hive e i relativi equivalenti BigQuery:
Hive | BigQuery |
---|---|
ASCII
|
TO_CODE_POINTS(string_expr)[OFFSET(0)]
|
HEX
|
TO_HEX
|
LENGTH
|
CHAR_LENGTH
|
LENGTH
|
CHARACTER_LENGTH
|
CHR
|
CODE_POINTS_TO_STRING
|
CONCAT
|
CONCAT
|
LOWER
|
LOWER
|
LPAD
|
LPAD
|
LTRIM
|
LTRIM
|
REGEXP_EXTRACT
|
REGEXP_EXTRACT
|
REGEXP_REPLACE
|
REGEXP_REPLACE
|
REPLACE
|
REPLACE
|
REVERSE
|
REVERSE
|
RPAD
|
RPAD
|
RTRIM
|
RTRIM
|
SOUNDEX
|
SOUNDEX
|
SPLIT
|
SPLIT(instring, delimiter)[ORDINAL(tokennum)]
|
SUBSTR, \
SUBSTRING
|
SUBSTR
|
TRANSLATE
|
TRANSLATE
|
LTRIM
|
LTRIM
|
RTRIM
|
RTRIM
|
TRIM
|
TRIM
|
UPPER
|
UPPER
|
BigQuery offre le seguenti funzioni stringa aggiuntive:
Funzioni matematiche
La tabella seguente mostra le mappature tra le funzioni matematiche di Hive e i relativi equivalenti di BigQuery:
Hive | BigQuery |
---|---|
ABS
|
ABS
|
ACOS
|
ACOS
|
ASIN
|
ASIN
|
ATAN
|
ATAN
|
CEIL
|
CEIL
|
CEILING
|
CEILING
|
COS
|
COS
|
FLOOR
|
FLOOR
|
GREATEST
|
GREATEST
|
LEAST
|
LEAST
|
LN
|
LN
|
LNNVL
|
Utilizza con ISNULL .
|
LOG
|
LOG
|
MOD (% operator)
|
MOD
|
POWER
|
POWER, POW
|
RAND
|
RAND
|
ROUND
|
ROUND
|
SIGN
|
SIGN
|
SIN
|
SIN
|
SQRT
|
SQRT
|
HASH
|
FARM_FINGERPRINT, MD5, SHA1, SHA256, SHA512
|
STDDEV_POP
|
STDDEV_POP
|
STDDEV_SAMP
|
STDDEV_SAMP
|
TAN
|
TAN
|
TRUNC
|
TRUNC
|
NVL
|
IFNULL(expr, 0), COALESCE(exp, 0)
|
BigQuery offre le seguenti funzioni matematiche aggiuntive:
Funzioni logiche e condizionali
La tabella seguente mostra le mappature tra logici Hive le funzioni condizionali e i loro equivalenti BigQuery:
Hive | BigQuery |
---|---|
CASE
|
CASE
|
COALESCE
|
COALESCE
|
NVL
|
IFNULL(expr, 0), COALESCE(exp, 0)
|
NULLIF
|
NULLIF
|
IF
|
IF(expr, true_result, else_result)
|
ISNULL
|
IS NULL
|
ISNOTNULL
|
IS NOT NULL
|
NULLIF
|
NULLIF
|
Funzioni definite dall'utente e funzioni definite dall'utente
BigQuery supporta le funzioni UDF, ma non le funzioni aggregate definite dall'utente (UDAF).
Sintassi DML
Questa sezione illustra le differenze nel Data Manipulation Language (DML) tra Hive e BigQuery.
Istruzione INSERT
La maggior parte degli istruzioni Hive INSERT
è compatibile con
in BigQuery. La seguente tabella mostra le eccezioni:
Hive | BigQuery |
---|---|
INSERT INTO TABLE tablename [PARTITION (partcol1[=val1], partcol2[=val2] ...)] VALUES values_row [, values_row ...]
|
INSERT INTO table (...) VALUES (...);
Nota: in BigQuery, l'omissione dei nomi delle colonne nell'istruzione |
INSERT OVERWRITE [LOCAL] DIRECTORY directory1
|
BigQuery non supporta le operazioni di inserimento e sovrascrittura.
È possibile eseguire la migrazione di questa sintassi Hive alle istruzioni TRUNCATE e INSERT .
|
BigQuery impone Quote DML che limita il numero di istruzioni DML che puoi eseguire ogni giorno. Per fare il miglior uso possibile della quota, valuta i seguenti approcci:
Combina più righe in una singola istruzione
INSERT
, anziché una riga per ogni operazioneINSERT
.Combina più istruzioni DML (incluse
INSERT
) utilizzando un'istruzioneMERGE
.Utilizza
CREATE TABLE ... AS SELECT
per creare e completare nuove tabelle.
Istruzione UPDATE
La maggior parte delle istruzioni UPDATE
di Hive è compatibile con
BigQuery. La seguente tabella mostra le eccezioni:
Hive | BigQuery |
---|---|
UPDATE tablename SET column = value [, column = value ...] [WHERE expression]
|
UPDATE table
Nota: tutte le istruzioni |
DELETE
e TRUNCATE
estratti conto
Puoi utilizzare le istruzioni DELETE
o TRUNCATE
per rimuovere righe da una tabella senza influire sullo schema o sugli indici della tabella.
In BigQuery, l'istruzione DELETE
deve avere una clausola WHERE
.
Per saperne di più su DELETE
in BigQuery, vedi
DELETE
esempi.
Hive | BigQuery |
---|---|
DELETE FROM tablename [WHERE expression]
|
DELETE FROM table_name
WHERE TRUE
Le istruzioni |
TRUNCATE [TABLE] table_name [PARTITION partition_spec];
|
TRUNCATE TABLE [[project_name.]dataset_name.]table_name
|
Istruzione MERGE
L'istruzione MERGE
può combinare le operazioni INSERT
, UPDATE
e DELETE
in un'unica istruzione upsert ed eseguire le operazioni. L'operazione MERGE
deve corrispondere a una riga di origine al massimo per ogni riga di destinazione.
Hive | BigQuery |
---|---|
MERGE INTO
ON
|
MERGE target
USING source
Nota: devi elencare tutte le colonne che devono essere aggiornate. |
Istruzione ALTER
La seguente tabella fornisce i dettagli sulla conversione delle istruzioni CREATE VIEW
da Hive a BigQuery:
Funzione | Hive | BigQuery |
---|---|---|
Rename table
|
ALTER TABLE table_name RENAME TO new_table_name;
|
Non supportati. Una soluzione alternativa è utilizzare un job di copia con il nome che preferisci come tabella di destinazione ed eliminare quella precedente.
|
Table properties
|
ALTER TABLE table_name SET TBLPROPERTIES table_properties;
|
{ALTER TABLE | ALTER TABLE IF EXISTS}
|
SerDe properties (Serialize and deserialize)
|
ALTER TABLE table_name [PARTITION partition_spec] SET SERDE serde_class_name [WITH SERDEPROPERTIES serde_properties];
|
La serializzazione e la deserializzazione sono gestite dal servizio BigQuery e non è configurabile dall'utente.
Per scoprire come consentire a BigQuery di leggere i dati da file CSV, JSON, AVRO File PARQUET o ORC, vedi Creare tabelle esterne di Cloud Storage. Supporta i formati di esportazione CSV, JSON, AVRO e PARQUET. Per saperne di più, consulta Formati di esportazione e tipi di compressione. |
Table storage properties
|
ALTER TABLE table_name CLUSTERED BY (col_name, col_name, ...) [SORTED BY (col_name, ...)]
INTO num_buckets BUCKETS;
|
Non supportata per gli estratti conto ALTER .
|
Skewed table
|
Skewed:
ALTER TABLE table_name SKEWED BY (col_name1, col_name2, ...)
ON ([(col_name1_value, col_name2_value, ...) [, (col_name1_value, col_name2_value), ...]
|
Il bilanciamento dello spazio di archiviazione per le query sulle prestazioni è gestito dal servizio BigQuery e non è configurabile. |
Table constraints
|
ALTER TABLE table_name ADD CONSTRAINT constraint_name PRIMARY KEY (column, ...) DISABLE NOVALIDATE;
ALTER TABLE table_name ADD CONSTRAINT constraint_name FOREIGN KEY (column, ...) REFERENCES table_name(column, ...) DISABLE NOVALIDATE RELY;
|
ALTER TABLE [[project_name.]dataset_name.]table_name ADD [CONSTRAINT [IF NOT EXISTS] [constraint_name]] constraint NOT ENFORCED; ALTER TABLE [[project_name.]dataset_name.]table_name ADD PRIMARY KEY(column_list) NOT ENFORCED;
Per saperne di più, consulta l'Informativa su |
Add partition
|
ALTER TABLE table_name ADD [IF NOT EXISTS] PARTITION partition_spec [LOCATION 'location'][, PARTITION partition_spec [LOCATION 'location'], ...];
|
Non supportati. Quando vengono caricati dati con nuovi valori nelle colonne di partizione, vengono aggiunte altre partizioni necessarie. Per saperne di più, consulta Gestione delle tabelle partizionate. |
Rename partition
|
ALTER TABLE table_name PARTITION partition_spec RENAME TO PARTITION partition_spec;
|
Non supportati. |
Exchange partition
|
-- Move partition from table_name_1 to table_name_2
|
Non supportati. |
Recover partition
|
MSCK [REPAIR] TABLE table_name [ADD/DROP/SYNC PARTITIONS];
|
Non supportati. |
Drop partition
|
ALTER TABLE table_name DROP [IF EXISTS] PARTITION partition_spec[, PARTITION partition_spec, ...]
[IGNORE PROTECTION] [PURGE];
|
Supportato utilizzando i seguenti metodi:
Per ulteriori informazioni, vedi Eliminare una partizione. |
(Un)Archive partition
|
ALTER TABLE table_name ARCHIVE PARTITION partition_spec;
ALTER TABLE table_name UNARCHIVE PARTITION partition_spec;
|
Non supportati. |
Table and partition file format
|
ALTER TABLE table_name [PARTITION partition_spec] SET FILEFORMAT file_format;
|
Non supportati. |
Table and partition location
|
ALTER TABLE table_name [PARTITION partition_spec] SET LOCATION "new location";
|
Non supportati. |
Table and partition touch
|
ALTER TABLE table_name TOUCH [PARTITION partition_spec];
|
Non supportati. |
Table and partition protection
|
ALTER TABLE table_name [PARTITION partition_spec] ENABLE|DISABLE NO_DROP [CASCADE];
|
Non supportati. |
Table and partition compact
|
ALTER TABLE table_name [PARTITION (partition_key = 'partition_value' [, ...])]
COMPACT 'compaction_type'[AND WAIT]
|
Non supportati. |
Table and artition concatenate
|
ALTER TABLE table_name [PARTITION (partition_key = 'partition_value' [, ...])] CONCATENATE;
|
Non supportati. |
Table and partition columns
|
ALTER TABLE table_name [PARTITION (partition_key = 'partition_value' [, ...])] UPDATE COLUMNS;
|
Non supportato per le istruzioni ALTER TABLE .
|
Column name, type, position, and comment
|
ALTER TABLE table_name [PARTITION partition_spec] CHANGE [COLUMN] col_old_name col_new_name column_type
[COMMENT col_comment] [FIRST|AFTER column_name] [CASCADE|RESTRICT];
|
Non supportati. |
Sintassi DDL
Questa sezione illustra le differenze nella sintassi del Data Definition Language (DDL) tra Hive e BigQuery.
CREATE TABLE
e DROP TABLE
estratti conto
La seguente tabella fornisce i dettagli sulla conversione delle istruzioni CREATE TABLE
da Hive a BigQuery:
Tipo | Hive | BigQuery |
---|---|---|
Tabelle gestite | create table table_name (
|
CREATE TABLE `myproject`.mydataset.table_name (
|
Tabelle partizionate | create table table_name (
|
CREATE TABLE `myproject`.mydataset.table_name (
|
Create table as select (CTAS)
|
CREATE TABLE new_key_value_store
|
CREATE TABLE `myproject`.mydataset.new_key_value_store
Quando esegui il partizionamento per data, rimuovi il commento da quanto segue:
Quando esegui il partizionamento per data, rimuovi il commento dal codice seguente. Ti consigliamo di utilizzare
|
Create Table Like:
Il formato |
CREATE TABLE empty_key_value_store
|
Non supportati. |
Tabelle ordinate in bucket (in cluster nella terminologia BigQuery) | CREATE TABLE page_view(
|
CREATE TABLE `myproject` mydataset.page_view (
Per saperne di più, vedi Creare e utilizzare tabelle in cluster. |
Tabelle disallineate (tabelle in cui una o più colonne hanno valori disallineati) | CREATE TABLE list_bucket_multiple (col1 STRING, col2 int, col3 STRING)
|
Non supportati. |
Tabelle temporanee | CREATE TEMPORARY TABLE list_bucket_multiple (
|
Puoi farlo utilizzando la data e l'ora di scadenza come segue:
|
Tabelle transazionali | CREATE TRANSACTIONAL TABLE transactional_table_test(key string, value string) PARTITIONED BY(ds string) STORED AS ORC;
|
Tutte le modifiche alle tabelle in BigQuery sono conformi ad ACID (atomicità, coerenza, isolamento, durabilità). |
Elimina tabella | DROP TABLE [IF EXISTS] table_name [PURGE];
|
{DROP TABLE | DROP TABLE IF EXISTS}
|
Tronca tabella | TRUNCATE TABLE table_name [PARTITION partition_spec];
|
Non supportati. Sono disponibili le seguenti soluzioni alternative:
Nota: è possibile troncare anche partizioni specifiche. Per ulteriori informazioni, vedi Eliminare una partizione. |
Estratti conto CREATE EXTERNAL TABLE
e DROP EXTERNAL TABLE
Per il supporto delle tabelle esterne in BigQuery, consulta Introduzione alle origini dati esterne.
CREATE VIEW
e DROP VIEW
estratti conto
La seguente tabella fornisce i dettagli sulla conversione delle istruzioni CREATE VIEW
da Hive a BigQuery:
Hive | BigQuery |
---|---|
CREATE VIEW [IF NOT EXISTS] [db_name.]view_name [(column_name [COMMENT column_comment], ...) ]
|
{CREATE VIEW | CREATE VIEW IF NOT EXISTS | CREATE OR REPLACE VIEW}
|
CREATE MATERIALIZED VIEW [IF NOT EXISTS] [db_name.]materialized_view_name
|
CREATE MATERIALIZED VIEW [IF NOT EXISTS] \
[project_id].[dataset_id].materialized_view_name
|
Estratti conto CREATE FUNCTION
e DROP FUNCTION
La tabella seguente fornisce dettagli sulla conversione delle stored procedure da Da Hive in BigQuery:
Hive | BigQuery |
---|---|
CREATE TEMPORARY FUNCTION function_name AS class_name;
|
CREATE { TEMPORARY | TEMP } FUNCTION function_name ([named_parameter[, ...]])
|
DROP TEMPORARY FUNCTION [IF EXISTS] function_name;
|
Non supportati. |
CREATE FUNCTION [db_name.]function_name AS class_name
|
Supportata per i progetti inclusi nella lista consentita come funzionalità alpha.
|
DROP FUNCTION [IF EXISTS] function_name;
|
DROP FUNCTION [ IF EXISTS ] function_name
|
RELOAD FUNCTION;
|
Non supportati. |
Estratti conto CREATE MACRO
e DROP MACRO
La tabella seguente fornisce dettagli sulla conversione delle istruzioni SQL procedurali utilizzata nella creazione di macro da Hive a BigQuery con dichiarazione delle variabili e assegnazione:
Hive | BigQuery |
---|---|
CREATE TEMPORARY MACRO macro_name([col_name col_type, ...]) expression;
|
Non supportati. In alcuni casi, questa può essere sostituita con una funzione definita dall'utente. |
DROP TEMPORARY MACRO [IF EXISTS] macro_name;
|
Non supportati. |
Codici e messaggi di errore
I codici di errore Hive e i codici di errore BigQuery sono diversi. Se la logica dell'applicazione rileva gli errori, elimina l'origine dell'errore perché BigQuery non restituisce gli stessi codici di errore.
In BigQuery, è comune utilizzare le viste INFORMATION_SCHEMA o i log di controllo per esaminare gli errori.
Garanzie di coerenza e isolamento delle transazioni
Sia Hive che BigQuery supportano le transazioni con semantica ACID. Le transazioni sono è attivata per impostazione predefinita in Hive 3.
Semantica ACID
Hive supporta l'isolamento degli snapshot. Quando esegui una query, questa viene fornita con uno snapshot coerente delle il database, che utilizza fino al termine della sua esecuzione. Hive fornisce la semantica dell'ACID completa a livello di riga, consentendo a un'applicazione di aggiungere righe quando un'altra applicazione legge la stessa partizione senza interferire tra loro.
BigQuery offre un controllo della contemporaneità ottimistico (first per il commit delle vincite) con isolamento snapshot, in cui una query legge gli ultimi dati di cui è stato eseguito il commit prima dell'inizio della query. Questo approccio garantisce lo stesso livello di coerenza per ogni riga e mutazione e tra le righe all'interno della stessa istruzione DML, evitando al contempo i deadlock. Per più aggiornamenti DML alla stessa tabella, BigQuery passa al controllo della concorrenza pessimistico. I job di caricamento possono essere eseguiti in modo indipendente e aggiungere tabelle. ma BigQuery non fornisce un confine esplicito della transazione durante la sessione.
Transazioni
Hive non supporta le transazioni con più dichiarazioni.
Non supporta le istruzioni BEGIN
, COMMIT
e ROLLBACK
. In Hive, tutte le operazioni linguistiche vengono sottoposte a commit automatico.
BigQuery supporta le transazioni con più istruzioni all'interno di una singola query o in più query quando utilizzi le sessioni. Una transazione con più istruzioni consente di eseguire operazioni di mutazione, ad esempio l'inserimento o l'eliminazione di righe da una o più tabelle e l'applicazione del commit o il rollback delle modifiche. Per ulteriori informazioni, consulta la sezione Transazioni con più istruzioni.