Introduzione a SQL in BigQuery

Questo documento fornisce una panoramica delle istruzioni e dei dialetti SQL supportati in BigQuery.

Panoramica

GoogleSQL è conforme ad ANSI Linguaggio di query strutturato (SQL) che include i seguenti tipi di istruzioni supportate:

Dialetti SQL BigQuery

BigQuery supporta il dialetto GoogleSQL, ma un modello È disponibile anche il dialetto SQL. Se non hai mai utilizzato BigQuery, GoogleSQL in quanto supporta la più ampia gamma funzionalità. Ad esempio, caratteristiche come le istruzioni DDL e DML sono supportati usando GoogleSQL. L'SQL precedente viene mantenuto per le versioni precedenti compatibilità e consigliamo ai clienti eseguire la migrazione se utilizzano l'SQL precedente.

Passaggio dal dialetto predefinito

L'interfaccia che utilizzi per eseguire query sui dati determina quale dialetto di query è predefinito. Per passare a un dialetto diverso:

Console

Il dialetto predefinito per la console Google Cloud è GoogleSQL. A cambia il dialetto in SQL precedente:

  1. Nella console Google Cloud, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nell'editor query, fai clic sul pulsante Altro > Impostazioni query.

  3. Nella sezione Opzioni avanzate, per Dialetto SQL, fai clic su Precedente, quindi fai clic su Salva. Imposta l'opzione SQL precedente per questo query. Quando fai clic su Crea una nuova query per creare una nuova query, devi selezionare di nuovo l'opzione SQL precedente.

SQL

Il dialetto SQL predefinito è GoogleSQL. Puoi impostare il dialetto SQL includendo il prefisso #standardSQL o #legacySQL nella query. Questi prefissi di query non sono sensibili alle maiuscole, devono precedere la query e devono essere separate dalla query da un carattere di nuova riga. Le seguenti esempio imposta il dialetto su SQL precedente e interroga il set di dati sulla natalità:

  1. Nella console Google Cloud, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nell'editor query, inserisci la seguente istruzione:

    #legacySQL
    SELECT
      weight_pounds, state, year, gestation_weeks
    FROM
      [bigquery-public-data:samples.natality]
    ORDER BY
      weight_pounds DESC
    LIMIT
      10;
    

  3. Fai clic su Esegui.

Per ulteriori informazioni su come eseguire le query, vedi Eseguire una query interattiva.

bq

Il dialetto predefinito delle query nello strumento a riga di comando bq è SQL precedente. A passa al dialetto GoogleSQL, aggiungi --use_legacy_sql=false o --nouse_legacy_sql all'istruzione della riga di comando.

Passa al dialetto GoogleSQL

Per utilizzare la sintassi GoogleSQL in un job di query, imposta use_legacy_sql su false.

  bq query \
  --use_legacy_sql=false \
  'SELECT
    word
  FROM
    `bigquery-public-data.samples.shakespeare`'

Imposta GoogleSQL come dialetto predefinito

Puoi impostare GoogleSQL come dialetto predefinito per lo strumento a riga di comando. la shell interattiva modificando il file di configurazione dello strumento a riga di comando: .bigqueryrc.

Per ulteriori informazioni su .bigqueryrc, vedi Impostazione di valori predefiniti per flag specifici dei comandi.

Per impostare --use_legacy_sql=false in .bigqueryrc:

  1. Apri .bigqueryrc in un editor di testo. Per impostazione predefinita, .bigqueryrc deve essere in nella tua directory utente, ad esempio $HOME/.bigqueryrc.
  2. Aggiungi il testo seguente al file. In questo esempio, GoogleSQL viene impostato come sintassi predefinita per le query e per il comando mk (utilizzata quando crei una ). Se hai già configurato i valori predefiniti per il comando query o mk non occorre aggiungere di nuovo [query] o [mk].

    [query]
    --use_legacy_sql=false
    [mk]
    --use_legacy_sql=false
    
  3. Salva e chiudi il file.

  4. Se utilizzi la shell interattiva, devi uscire e riavviare per applicare le modifiche.

Per informazioni sui flag della riga di comando disponibili, vedi Riferimento per lo strumento a riga di comando bq.

C#

Prima di provare questo esempio, segui le istruzioni per la configurazione di C# nel Guida rapida di BigQuery con librerie client. Per ulteriori informazioni, consulta API C# BigQuery documentazione di riferimento.

Per eseguire l'autenticazione su BigQuery, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per le librerie client.

Per impostazione predefinita, la libreria C# utilizza GoogleSQL.

Passa al dialetto SQL precedente

Per utilizzare la sintassi SQL precedente in un job di query, imposta UseLegacySql su true.


using Google.Cloud.BigQuery.V2;
using System;

public class BigQueryQueryLegacy
{
    public void QueryLegacy(
        string projectId = "your-project-id"
    )
    {
        BigQueryClient client = BigQueryClient.Create(projectId);
        string query = @"
            SELECT name FROM [bigquery-public-data:usa_names.usa_1910_2013]
            WHERE state = 'TX'
            LIMIT 100";
        BigQueryJob job = client.CreateQueryJob(
            sql: query,
            parameters: null,
            options: new QueryOptions { UseLegacySql = true });
        // Wait for the job to complete.
        job = job.PollUntilCompleted().ThrowOnAnyError();
        // Display the results
        foreach (BigQueryRow row in client.GetQueryResults(job.Reference))
        {
            Console.WriteLine($"{row["name"]}");
        }
    }
}

Vai

Prima di provare questo esempio, segui le istruzioni per la configurazione di Go nel Guida rapida di BigQuery con librerie client. Per ulteriori informazioni, consulta API Go BigQuery documentazione di riferimento.

Per eseguire l'autenticazione su BigQuery, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per le librerie client.

Per impostazione predefinita, la libreria client Go utilizza GoogleSQL.

Passa al dialetto SQL precedente

Per utilizzare la sintassi SQL precedente in un job di query, imposta la proprietà UseLegacySQL della configurazione della query a true.

import (
	"context"
	"fmt"
	"io"

	"cloud.google.com/go/bigquery"
	"google.golang.org/api/iterator"
)

// queryLegacy demonstrates running a query using Legacy SQL.
func queryLegacy(w io.Writer, projectID, sqlString string) error {
	// projectID := "my-project-id"
	// sqlString = "SELECT 3 as somenum"
	ctx := context.Background()
	client, err := bigquery.NewClient(ctx, projectID)
	if err != nil {
		return fmt.Errorf("bigquery.NewClient: %w", err)
	}
	defer client.Close()

	q := client.Query(sqlString)
	q.UseLegacySQL = true

	// Run the query and process the returned row iterator.
	it, err := q.Read(ctx)
	if err != nil {
		return fmt.Errorf("query.Read(): %w", err)
	}
	for {
		var row []bigquery.Value
		err := it.Next(&row)
		if err == iterator.Done {
			break
		}
		if err != nil {
			return err
		}
		fmt.Fprintln(w, row)
	}
	return nil
}

Java

Prima di provare questo esempio, segui le istruzioni per la configurazione di Java nel Guida rapida di BigQuery con librerie client. Per ulteriori informazioni, consulta API Java BigQuery documentazione di riferimento.

Per eseguire l'autenticazione su BigQuery, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per le librerie client.

Per impostazione predefinita, la libreria client Java utilizza GoogleSQL.

Passa al dialetto SQL precedente

Per utilizzare la sintassi SQL precedente in un job di query, imposta il parametro useLegacySql a true.

import com.google.cloud.bigquery.BigQuery;
import com.google.cloud.bigquery.BigQueryException;
import com.google.cloud.bigquery.BigQueryOptions;
import com.google.cloud.bigquery.QueryJobConfiguration;
import com.google.cloud.bigquery.TableResult;

public class RunLegacyQuery {

  public static void main(String[] args) {
    runLegacyQuery();
  }

  public static void runLegacyQuery() {
    try {
      // Initialize client that will be used to send requests. This client only needs to be created
      // once, and can be reused for multiple requests.
      BigQuery bigquery = BigQueryOptions.getDefaultInstance().getService();

      // To use legacy SQL syntax, set useLegacySql to true.
      String query =
          "SELECT corpus FROM [bigquery-public-data:samples.shakespeare] GROUP BY corpus;";
      QueryJobConfiguration queryConfig =
          QueryJobConfiguration.newBuilder(query).setUseLegacySql(true).build();

      // Execute the query.
      TableResult result = bigquery.query(queryConfig);

      // Print the results.
      result.iterateAll().forEach(rows -> rows.forEach(row -> System.out.println(row.getValue())));

      System.out.println("Legacy query ran successfully");
    } catch (BigQueryException | InterruptedException e) {
      System.out.println("Legacy query did not run \n" + e.toString());
    }
  }
}

Node.js

Prima di provare questo esempio, segui le istruzioni per la configurazione di Node.js nel Guida rapida di BigQuery con librerie client. Per ulteriori informazioni, consulta API Node.js BigQuery documentazione di riferimento.

Per eseguire l'autenticazione su BigQuery, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per le librerie client.

Per impostazione predefinita, la libreria client Node.js utilizza GoogleSQL.

Passa al dialetto SQL precedente

Per utilizzare la sintassi SQL precedente in un job di query, imposta il parametro useLegacySql a true.

// Import the Google Cloud client library
const {BigQuery} = require('@google-cloud/bigquery');
const bigquery = new BigQuery();

async function queryLegacy() {
  // Queries the U.S. given names dataset for the state of Texas using legacy SQL.

  const query =
    'SELECT word FROM [bigquery-public-data:samples.shakespeare] LIMIT 10;';

  // For all options, see https://cloud.google.com/bigquery/docs/reference/rest/v2/jobs/query
  const options = {
    query: query,
    // Location must match that of the dataset(s) referenced in the query.
    location: 'US',
    useLegacySql: true,
  };

  // Run the query as a job
  const [job] = await bigquery.createQueryJob(options);
  console.log(`Job ${job.id} started.`);

  // Wait for the query to finish
  const [rows] = await job.getQueryResults();

  // Print the results
  console.log('Rows:');
  rows.forEach(row => console.log(row));
}

PHP

Prima di provare questo esempio, segui le istruzioni per la configurazione di PHP nel Guida rapida di BigQuery con librerie client. Per ulteriori informazioni, consulta API PHP BigQuery documentazione di riferimento.

Per eseguire l'autenticazione su BigQuery, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per le librerie client.

Per impostazione predefinita, la libreria client PHP utilizza GoogleSQL.

Passa al dialetto SQL precedente

Per utilizzare la sintassi SQL precedente in un job di query, imposta il parametro useLegacySql a true.

use Google\Cloud\BigQuery\BigQueryClient;

/**
 * Query using legacy sql
 *
 * @param string $projectId The project Id of your Google Cloud Project.
 */
function query_legacy(string $projectId): void
{
    $query = 'SELECT corpus FROM [bigquery-public-data:samples.shakespeare] GROUP BY corpus';

    $bigQuery = new BigQueryClient([
      'projectId' => $projectId,
    ]);
    $jobConfig = $bigQuery->query($query)->useLegacySql(true);

    $queryResults = $bigQuery->runQuery($jobConfig);

    $i = 0;
    foreach ($queryResults as $row) {
        printf('--- Row %s ---' . PHP_EOL, ++$i);
        foreach ($row as $column => $value) {
            printf('%s: %s' . PHP_EOL, $column, json_encode($value));
        }
    }
    printf('Found %s row(s)' . PHP_EOL, $i);
}

Python

Prima di provare questo esempio, segui le istruzioni per la configurazione di Python nel Guida rapida di BigQuery con librerie client. Per ulteriori informazioni, consulta API Python BigQuery documentazione di riferimento.

Per eseguire l'autenticazione su BigQuery, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per le librerie client.

Per impostazione predefinita, la libreria client Python utilizza GoogleSQL.

Passa al dialetto SQL precedente

Per utilizzare la sintassi SQL precedente in un job di query, imposta il parametro use_legacy_sql a True.

from google.cloud import bigquery

# Construct a BigQuery client object.
client = bigquery.Client()

query = (
    "SELECT name FROM [bigquery-public-data:usa_names.usa_1910_2013] "
    'WHERE state = "TX" '
    "LIMIT 100"
)

# Set use_legacy_sql to True to use legacy SQL syntax.
job_config = bigquery.QueryJobConfig(use_legacy_sql=True)

# Start the query and waits for query job to complete, passing in the extra configuration.
results = client.query_and_wait(
    query, job_config=job_config
)  # Make an API request.

print("The query data:")
for row in results:
    print(row)

Ruby

Prima di provare questo esempio, segui le istruzioni per la configurazione di Ruby nel Guida rapida di BigQuery con librerie client. Per ulteriori informazioni, consulta API Ruby BigQuery documentazione di riferimento.

Per eseguire l'autenticazione su BigQuery, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per le librerie client.

Per impostazione predefinita, la libreria client Ruby utilizza GoogleSQL.

Passa al dialetto SQL precedente

Per utilizzare la sintassi SQL precedente in un job di query, passa l'opzione legacy_sql: true con la tua query.

require "google/cloud/bigquery"

def query_legacy
  bigquery = Google::Cloud::Bigquery.new
  sql = "SELECT name FROM [bigquery-public-data:usa_names.usa_1910_2013] " \
        "WHERE state = 'TX' " \
        "LIMIT 100"

  results = bigquery.query sql, legacy_sql: true do |config|
    # Location must match that of the dataset(s) referenced in the query.
    config.location = "US"
  end

  results.each do |row|
    puts row.inspect
  end
end

Passaggi successivi