Tipi di dati SQL legacy

Questo documento descrive in dettaglio i tipi di dati supportati dalla sintassi delle query SQL precedente di BigQuery. La sintassi delle query preferita per BigQuery è GoogleSQL. Per informazioni sui tipi di dati in GoogleSQL, consulta i tipi di dati di GoogleSQL.

Tipi di dati SQL legacy

I dati possono includere i seguenti tipi di dati:

Tipo di dati Valori possibili
STRINGA Dati relativi ai caratteri a lunghezza variabile (UTF-8).
BYTES Dati binari a lunghezza variabile.
  • I dati BYTES importati devono essere codificati in base64, ad eccezione dei dati Avro BYTES, che BigQuery può leggere e convertire.
  • I dati BYTES letti da una tabella BigQuery sono codificati in base64, a meno che non esporti in formato Avro, nel qual caso si applica il tipo di dati byte Avro.
INTERO

Numero intero con segno a 64 bit.

Se utilizzi l'API BigQuery per caricare un numero intero al di fuori dell'intervallo di [-253+1, 253-1] (nella maggior parte dei casi, questo significa maggiore di 9.007.199.254.740.991), in una colonna di numeri interi (INT64), devi trasmetterlo come stringa per evitare il danneggiamento dei dati. Questo problema è causato da una limitazione delle dimensioni dei numeri interi in JSON/ECMAScript. Per maggiori informazioni, consulta la sezione Numeri di RFC 7159.

FLOAT Formato in virgola mobile a precisione doppia.
NUMERIC L'SQL precedente ha un supporto limitato per NUMERIC. Per maggiori informazioni, consulta la sezione Numeri esatti nell'SQL precedente.
GRANDE NUMERO L'SQL precedente ha un supporto limitato per BIGNUMERIC. Per maggiori informazioni, consulta la sezione Numeri esatti nell'SQL precedente.
BOOLEANO
  • Formato CSV: 1 o 0, true o false, t o f, yes o no o y o n (senza distinzione tra maiuscole e minuscole).
  • Formato JSON: true o false (senza distinzione tra maiuscole e minuscole).
RECORD Una raccolta di uno o più altri campi.
TIMESTAMP

Puoi descrivere i tipi di dati TIMESTAMP come timestamp UNIX o date/ora del calendario. BigQuery archivia internamente i dati TIMESTAMP come timestamp UNIX con una precisione di microsecondi.

Timestamp UNIX

Un numero decimale positivo o negativo. Un numero positivo specifica il numero di secondi trascorsi dall'epoca (1970-01-01 00:00:00 UTC), mentre un numero negativo specifica il numero di secondi prima dell'epoca. Vengono mantenute fino a sei cifre decimali (precisione dei microsecondi).

Stringhe di data e ora

Una stringa di data e ora nel formato YYYY-MM-DD HH:MM:SS. Sono supportati gli identificatori UTC e Z.

Puoi fornire uno scarto con fuso orario nelle stringhe di data e ora, ma BigQuery non conserva l'offset dopo aver convertito il valore nel suo formato interno. Se devi conservare i dati originali relativi al fuso orario, archivia la differenza di fuso orario in una colonna separata. Lo zero iniziale è obbligatorio quando specifichi uno scarto con fuso orario a una cifra.

Se utilizzi il formato JSON, le stringhe di data e ora devono essere racchiuse tra virgolette.

Esempi

I seguenti esempi mostrano metodi identici per descrivere date specifiche, sia nei formati di timestamp UNIX che di data e ora.

Evento Formato timestamp UNIX Formato stringa data/ora
Terremoto di lieve entità (M4.2) vicino a Oklahoma City

1408452095.220
1408452095.220000

2014-08-19 07:41:35.220 -05:00
2014-08-19 12:41:35.220 UTC
2014-08-19 12:41:35.220
2014-08-19 12:41:35.220000
2014-08-19T12:41:35.220Z
Neil Armstrong mette piede sulla luna

-14182916

1969-07-20 20:18:04
1969-07-20 20:18:04 UTC
1969-07-20T20:18:04
Scadenza per la correzione del bug Y10k

253402300800
2.53402300800e11

10000-01-01 00:00
DATA L'SQL precedente ha un supporto limitato per DATE. Per maggiori informazioni, consulta la pagina relativa al tempo civile in SQL precedente.
TEMPO L'SQL precedente ha un supporto limitato per TIME. Per maggiori informazioni, consulta la pagina relativa al tempo civile in SQL precedente.
DATETIME L'SQL precedente ha un supporto limitato per DATETIME. Per maggiori informazioni, consulta la pagina relativa al tempo civile in SQL precedente.

Numeri esatti nell'SQL precedente

Puoi leggere valori NUMERIC o BIGNUMERIC in clausole non modificabili, come SELECT list (with aliases), GROUP BY keys, e campi passthrough nelle funzioni finestra e così via. Tuttavia, qualsiasi calcolo su valori NUMERIC o BIGNUMERIC, inclusi i confronti, produce risultati indefiniti.

Le seguenti funzioni di trasmissione e conversione sono supportate nell'SQL precedente:

  • CAST(<numeric> AS STRING)
  • CAST(<bignumeric> AS STRING)
  • CAST(<string> AS NUMERIC)
  • CAST(<string> AS BIGNUMERIC)

Ora civile in SQL precedente

Puoi leggere i tipi di dati relativi all'ora civile (DATE, TIME e DATETIME) ed elaborarli con operatori non modificabili come SELECT list (with aliases), GROUP BY keys e campi passthrough in funzioni finestra e così via. Tuttavia, qualsiasi altro calcolo sui valori relativi all'ora civile, inclusi i confronti, produce risultati non definiti.

Le seguenti funzioni di trasmissione e conversione sono supportate nell'SQL precedente:

  • CAST(<date> AS STRING)
  • CAST(<time> AS STRING)
  • CAST(<datetime> AS STRING)
  • CAST(<string> AS DATE)
  • CAST(<string> AS TIME)
  • CAST(<string> AS DATETIME)

In pratica, l'SQL precedente interpreta i valori dell'ora civile come numeri interi, mentre le operazioni su numeri interi che ritieni siano valori dell'ora civile producono risultati imprevisti.

Per calcolare valori utilizzando tipi di dati dell'ora civile, prendi in considerazione GoogleSQL, che supporta tutte le operazioni SQL nei tipi di dati DATE, DATETIME e TIME.

Passaggi successivi