Tabellendefinitionsdatei für eine externe Datenquelle erstellen

Auf dieser Seite wird beschrieben, wie Sie eine Tabellendefinitionsdatei für eine externe Datenquelle erstellen. Eine externe Datenquelle (auch "föderierte Datenquelle" genannt) ist eine Datenquelle, für die auch dann direkt eine Abfrage ausgeführt werden kann, wenn die Daten nicht in BigQuery gespeichert sind.

Tabellendefinitionsdateien

Eine Tabellendefinitionsdatei enthält die Schemadefinition und Metadaten einer externen Tabelle, z. B. das Datenformat und zugehörige Eigenschaften. Beim Erstellen einer Tabellendefinitionsdatei können Sie die automatische Schemaerkennung verwenden, um das Schema für eine externe Datenquelle zu definieren. Sie können das Schema inline (in der Befehlszeile) einfügen oder eine JSON-Datei hinzufügen, die die Schemadefinition enthält.

Tabellendefinitionsdateien werden mit der BigQuery-Befehlszeile verwendet. Wenn Sie die REST API verwenden, gelten die Attribute in einer Tabellendefinitionsdatei auch für das Erstellen einer ExternalDataConfiguration. Wenn Sie eine externe Tabelle mithilfe der GCP Console oder der klassischen BigQuery-Web-UI erstellen, verwenden Sie keine Tabellendefinitionsdateien.

Tabellendefinitionsdateien können für die folgenden externen Datenquellen erstellt werden:

  • Cloud Storage

    • Kommagetrennte Werte (CSV)
    • Durch Zeilenumbruch getrenntes JSON
    • Avro-Dateien
    • Cloud Datastore-Exportdateien
    • Cloud Firestore-Exportdateien
  • Google Drive

    • Kommagetrennte Werte (CSV)
    • Durch Zeilenumbruch getrenntes JSON
    • Avro-Dateien
    • Google Tabellen
  • Cloud Bigtable

Hinweis

Zum Erstellen einer Tabellendefinitionsdatei benötigen Sie den URI für die Datenquelle:

Permanente und temporäre externe Tabellen

Sie können eine externe Datenquelle in BigQuery mithilfe einer permanenten Tabelle oder einer temporären Tabelle abfragen. Eine permanente Tabelle ist eine Tabelle, die in einem Dataset erstellt wird und mit Ihrer externen Datenquelle verknüpft ist. Da die Tabelle permanent ist, können Sie sie mithilfe von Zugriffssteuerungen auf Dataset-Ebene für andere Nutzer freigeben, die ebenfalls Zugriff auf die zugrunde liegende externe Datenquelle haben. Außerdem können Sie die Tabelle jederzeit abfragen.

Wenn Sie eine externe Datenquelle mithilfe einer temporären Tabelle abfragen, senden Sie einen Befehl, der eine Abfrage enthält und durch den eine nicht permanente, mit der externen Datenquelle verknüpfte Tabelle erstellt wird. Wenn Sie eine temporäre Tabelle verwenden, erstellen Sie keine Tabelle in einem Ihrer BigQuery-Datasets. Da die Tabelle nicht permanent in einem Dataset gespeichert wird, kann sie nicht für andere Nutzer freigegeben werden. Das Abfragen einer externen Datenquelle mithilfe einer temporären Tabelle eignet sich für einmalige Ad-hoc-Abfragen von externen Daten sowie für ETL-Vorgänge (Extraktion, Transformation, Laden).

Sie können eine Tabellendefinitionsdatei verwenden, um eine permanente oder temporäre externe Tabelle zu beschreiben.

Tabellendefinition mithilfe der automatischen Schemaerkennung erstellen

Bei Angabe einer CSV-, JSON- oder Google Tabellen-Datei ohne Einschluss einer Inline-Schemabeschreibung oder einer Schemadatei können Sie die Option "autodetect" in der Tabellendefinitionsdatei mit dem Flag --autodetect auf true setzen. Wenn die automatische Erkennung aktiviert ist, versucht BigQuery, das Schema automatisch abzuleiten. Weitere Informationen finden Sie unter Automatische Schemaerkennung in BigQuery.

Sie können die automatische Schemaerkennung verwenden, wenn Sie Tabellendefinitionen für Folgendes erstellen:

  • JSON-Dateien, die in Cloud Storage oder Google Drive gespeichert sind
  • CSV-Dateien, die in Cloud Storage oder Google Drive gespeichert sind
  • Google Tabellen-Dateien, die in Google Drive gespeichert sind

Cloud Storage

So erstellen Sie mithilfe der Befehlszeile eine Tabellendefinition für eine Cloud Storage-Datenquelle:

  1. Geben Sie im Befehlszeilentool den Befehl mkdef mit dem Flag --autodetect ein, um eine Tabellendefinition zu erstellen. Der Befehl mkdef erzeugt eine Tabellendefinitionsdatei im JSON-Format. Im folgenden Beispiel wird eine Tabellendefinition erstellt und die Ausgabe in eine Datei geschrieben – /tmp/file_name.

    Ersetzen Sie im Befehl Folgendes:

    • source_format mit Ihrem Dateiformat: NEWLINE_DELIMITED_JSON, CSV oder GOOGLE_SHEETS.
    • file_name mit dem Namen Ihrer Tabellendefinitionsdatei.
    • bucket_uri mit Ihrem Cloud Storage-URI, z. B. gs://mybucket/myfile.
    bq mkdef \
    --autodetect \
    --source_format=source_format \
    "bucket_uri" > /tmp/file_name
    
  2. (Optional) Öffnen Sie die Tabellendefinitionsdatei in einem Texteditor. Mit dem Befehl nano /tmp/file_name wird die Datei z. B. in Nano geöffnet. Die Datei für eine externe CSV-Datenquelle sollte wie unten dargestellt aussehen. Beachten Sie, dass "autodetect" auf true gesetzt ist.

    {
    "autodetect": true,
    "csvOptions": {
      "allowJaggedRows": false,
      "allowQuotedNewlines": false,
      "encoding": "UTF-8",
      "fieldDelimiter": ",",
      "quote": "\"",
      "skipLeadingRows": 0
    },
    "sourceFormat": "CSV",
    "sourceUris": [
      "bucket_uri"
    ]
    }
    
  3. (Optional) Bearbeiten Sie die Tabellendefinitionsdatei manuell, um allgemeine Einstellungen wie maxBadRecords und ignoreUnknownValues zu ändern, hinzuzufügen oder zu löschen. Es gibt keine Konfigurationseinstellungen speziell für JSON-Quelldateien, aber es gibt Einstellungen, die für CSV- und Google Tabellen-Dateien gelten. Weitere Informationen finden Sie in der API-Referenz unter ExternalDataConfiguration.

Google Drive

So erstellen Sie mithilfe der Befehlszeile eine Tabellendefinition für eine Google Drive-Datenquelle:

  1. Geben Sie im Befehlszeilentool den Befehl mkdef mit dem Flag --autodetect ein, um eine Tabellendefinition zu erstellen. Der Befehl mkdef erzeugt eine Tabellendefinitionsdatei im JSON-Format. Im folgenden Beispiel wird eine Tabellendefinition erstellt und die Ausgabe in eine Datei geschrieben – /tmp/file_name.

    Ersetzen Sie im Befehl Folgendes:

    • source_format mit Ihrem Dateiformat: NEWLINE_DELIMITED_JSON, CSV oder GOOGLE_SHEETS.
    • file_name mit dem Namen Ihrer Tabellendefinitionsdatei.
    • drive_uri mit Ihrem Google Drive-URI, z. B. https://drive.google.com/open?id=123ABCD123AbcD123Abcd.
    bq mkdef \
    --autodetect \
    --source_format=source_format \
    "drive_uri" > /tmp/file_name
    
  2. Öffnen Sie die Datei in einem Texteditor. Mit dem Befehl nano /tmp/file_name wird die Datei z. B. in Nano geöffnet. Die Datei sollte für eine externe Google Tabellen-Datenquelle wie unten dargestellt aussehen. Beachten Sie, dass "autodetect" auf true gesetzt ist.

    {
    "autodetect": true,
    "sourceFormat": "GOOGLE_SHEETS",
    "sourceUris": [
      "drive_uri"
    ]
    }
    
  3. (Optional) Bearbeiten Sie die Tabellendefinitionsdatei manuell, um allgemeine Einstellungen wie maxBadRecords und ignoreUnknownValues zu ändern, hinzuzufügen oder zu löschen. Es gibt keine Konfigurationseinstellungen speziell für JSON-Quelldateien, aber es gibt Einstellungen, die für CSV- und Google Tabellen-Dateien gelten. Weitere Informationen finden Sie in der API-Referenz unter ExternalDataConfiguration.

  4. Wenn Sie ein bestimmtes Tabellenblatt oder einen Zellenbereich in einer Google Tabellen-Datei angeben möchten, fügen Sie der Tabellendefinitionsdatei die Eigenschaft range hinzu. Zur Abfrage eines bestimmten Tabellenblatts geben Sie den Tabellenblattnamen an. Zur Abfrage eines Zellenbereichs geben Sie den Bereich so an: sheet_name!top_left_cell_id:bottom_right_cell_id. Beispiel "Sheet1!A1:B20". Wenn der Parameter range nicht angegeben wird, wird das erste Tabellenblatt der Datei verwendet.

Tabellendefinition mithilfe eines Inline-Schemas erstellen

Wenn Sie die automatische Schemaerkennung nicht verwenden möchten, können Sie eine Tabellendefinitionsdatei erstellen, indem Sie eine Inline-Schemadefinition angeben. Zum Erstellen einer Inline-Schemadefinition müssen Sie die Felder und Datentypen in der Befehlszeile im folgenden Format auflisten: field:data_type,field:data_type.

Sie können eine Inline-Schemadefinition verwenden, wenn Sie Tabellendefinitionsdateien für Folgendes erstellen:

  • JSON-Dateien, die in Cloud Storage oder Google Drive gespeichert sind
  • CSV-Dateien, die in Cloud Storage oder Google Drive gespeichert sind
  • Google Tabellen-Dateien, die in Google Drive gespeichert sind

So erstellen Sie mit der Befehlszeile eine Tabellendefinition für eine Cloud Storage-Datenquelle mithilfe einer Inline-Schemadefinition:

  1. Geben Sie im Befehlszeilentool den Befehl mkdef mit dem Flag --noautodetect ein, um eine Tabellendefinition zu erstellen. Der Befehl mkdef erzeugt eine Tabellendefinitionsdatei im JSON-Format. Im folgenden Beispiel wird eine Tabellendefinition erstellt und die Ausgabe in eine Datei geschrieben – /tmp/file_name.

    Ersetzen Sie im Befehl Folgendes:

    • source_format mit Ihrem Dateiformat: NEWLINE_DELIMITED_JSON, CSV oder GOOGLE_SHEETS.
    • uri mit Ihrem Cloud Storage-URI oder Ihrem Google Drive-URI. Beispiel: https://drive.google.com/open?id=123ABCD123AbcD123Abcd für Google Drive oder gs://mybucket/myfile für Cloud Storage.
    • field:data_type,field:data_type mit Ihrer Schemadefinition z. B. Name:STRING,Address:STRING, ...
    • file_name mit dem Namen Ihrer Tabellendefinitionsdatei.
    bq mkdef \
    --noautodetect \
    --source_format=source_format \
    "uri" \
    field:data_type,field:data_type > /tmp/file_name
    
  2. (Optional) Öffnen Sie die Tabellendefinitionsdatei in einem Texteditor. Mit dem Befehl nano /tmp/file_name wird die Datei z. B. in Nano geöffnet. Die Datei sollte wie unten dargestellt aussehen. Dabei ist "autodetect" nicht aktiviert und die Schemainformationen werden in die Tabellendefinitionsdatei geschrieben.

    {
    "schema": {
      "fields": [
        {
          "name": "field",
          "type": "data_type"
        },
        {
          "name": "field",
          "type": "data_type"
        }
        ...
      ]
    },
    "sourceFormat": "NEWLINE_DELIMITED_JSON",
    "sourceUris": [
      "uri"
    ]
    }
    
  3. (Optional) Bearbeiten Sie die Tabellendefinitionsdatei manuell, um allgemeine Einstellungen wie maxBadRecords und ignoreUnknownValues zu ändern, hinzuzufügen oder zu löschen. Es gibt keine Konfigurationseinstellungen speziell für JSON-Quelldateien, aber es gibt Einstellungen, die für CSV- und Google Tabellen-Dateien gelten. Weitere Informationen finden Sie in der API-Referenz unter ExternalDataConfiguration.

Tabellendefinition mithilfe einer JSON-Schemadatei erstellen

Wenn Sie weder die automatische Erkennung noch eine Inline-Schemadefinition verwenden möchten, können Sie eine JSON-Schemadatei erstellen und beim Erstellen der Tabellendefinition darauf verweisen. Sie müssen die JSON-Schemadatei manuell erstellen und sie muss sich auf Ihrem lokalen Computer befinden. Der Verweis auf eine JSON-Schemadatei in Cloud Storage oder Google Drive wird nicht unterstützt.

Sie können eine JSON-Schemadatei verwenden, wenn Sie Tabellendefinitionen für Folgendes erstellen:

  • JSON-Dateien, die in Cloud Storage oder Google Drive gespeichert sind
  • CSV-Dateien, die in Cloud Storage oder Google Drive gespeichert sind
  • Google Tabellen-Dateien, die in Google Drive gespeichert sind

Cloud Storage

So erstellen Sie mit der Befehlszeile eine Tabellendefinition für eine Cloud Storage-Datenquelle mithilfe einer JSON-Schemadatei:

  1. Geben Sie im Befehlszeilentool den Befehl mkdef mit dem Flag --noautodetect ein, um eine Tabellendefinition zu erstellen. Der Befehl mkdef erzeugt eine Tabellendefinitionsdatei im JSON-Format. Im folgenden Beispiel wird eine Tabellendefinition erstellt und die Ausgabe in eine Datei geschrieben /tmp/file_name.

    Ersetzen Sie im Befehl Folgendes:

    • source_format mit Ihrem Dateiformat: NEWLINE_DELIMITED_JSON, CSV oder GOOGLE_SHEETS.
    • file_name mit dem Namen Ihrer Tabellendefinitionsdatei.
    • bucket_uri mit Ihrem Cloud Storage-URI, z. B. gs://mybucket/myfile.
    • path_to_schema_file mit dem Speicherort der JSON-Schemadatei auf Ihrem lokalen Computer.
    bq mkdef \
    --noautodetect \
    --source_format=source_format \
    "bucket_uri" \
    path_to_schema_file > /tmp/file_name
    
  2. (Optional) Öffnen Sie die Tabellendefinitionsdatei in einem Texteditor. Mit dem Befehl nano /tmp/file_name wird die Datei z. B. in
    Nano geöffnet. Die Datei sollte wie unten dargestellt aussehen. Dabei ist "autodetect" nicht aktiviert und die Schemainformationen werden in die Tabellendefinitionsdatei geschrieben.

    {
    "schema": {
      "fields": [
        {
          "name": "field",
          "type": "data_type"
        },
        {
          "name": "field",
          "type": "data_type"
        }
        ...
      ]
    },
    "sourceFormat": "NEWLINE_DELIMITED_JSON",
    "sourceUris": [
      "bucket_uri"
    ]
    }
    
  3. (Optional) Bearbeiten Sie die Tabellendefinitionsdatei manuell, um allgemeine Einstellungen wie maxBadRecords und ignoreUnknownValues zu ändern, hinzuzufügen oder zu löschen. Es gibt keine Konfigurationseinstellungen speziell für JSON-Quelldateien, aber es gibt Einstellungen, die für CSV- und Google Tabellen-Dateien gelten. Weitere Informationen finden Sie in der API-Referenz unter ExternalDataConfiguration.

Google Drive

So erstellen Sie mit der Befehlszeile eine Tabellendefinition für eine Google Drive-Datenquelle mithilfe einer JSON-Schemadatei:

  1. Geben Sie im Befehlszeilentool den Befehl mkdef mit dem Flag --noautodetect ein, um eine Tabellendefinition zu erstellen. Der Befehl mkdef erzeugt eine Tabellendefinitionsdatei im JSON-Format. Im folgenden Beispiel wird eine Tabellendefinition erstellt und die Ausgabe in eine Datei geschrieben – /tmp/file_name.

    Ersetzen Sie im Befehl Folgendes:

    • source_format mit Ihrem Dateiformat: NEWLINE_DELIMITED_JSON, CSV oder GOOGLE_SHEETS.
    • drive_uri mit Ihrem Google Drive-URI, z. B. https://drive.google.com/open?id=123ABCD123AbcD123Abcd.
    • path_to_schema_file mit dem Speicherort der JSON-Schemadatei auf Ihrem lokalen Computer.
    • file_name mit dem Namen Ihrer Tabellendefinitionsdatei.
    bq mkdef \
    --noautodetect \
    --source_format=source_format \
    "drive_uri" \
    path_to_schema_file > /tmp/file_name
    
  2. Öffnen Sie die Datei in einem Texteditor. Mit dem Befehl nano /tmp/file_name wird die Datei z. B. in Nano geöffnet. Die Datei sollte wie unten dargestellt aussehen. Dabei ist "autodetect" nicht aktiviert und die Schemainformationen werden in die Tabellendefinitionsdatei geschrieben.

    {
    "schema": {
      "fields": [
        {
          "name": "field",
          "type": "data_type"
        },
        {
          "name": "field",
          "type": "data_type"
        }
        ...
      ]
    },
    "sourceFormat": "GOOGLE_SHEETS",
    "sourceUris": [
      "drive_uri"
    ]
    }
    
  3. (Optional) Bearbeiten Sie die Tabellendefinitionsdatei manuell, um allgemeine Einstellungen wie maxBadRecords und ignoreUnknownValues zu ändern, hinzuzufügen oder zu löschen. Es gibt keine Konfigurationseinstellungen speziell für JSON-Quelldateien, aber es gibt Einstellungen, die für CSV- und Google Tabellen-Dateien gelten. Weitere Informationen finden Sie in der API-Referenz unter ExternalDataConfiguration.

  4. Wenn Sie ein bestimmtes Tabellenblatt oder einen Zellenbereich in einer Google Tabellen-Datei angeben möchten, fügen Sie der Tabellendefinitionsdatei die Eigenschaft range hinzu. Zur Abfrage eines bestimmten Tabellenblatts geben Sie den Tabellenblattnamen an. Zur Abfrage eines Zellenbereichs geben Sie den Bereich so an: sheet_name!top_left_cell_id:bottom_right_cell_id. Beispiel "Sheet1!A1:B20". Wenn der Parameter range nicht angegeben wird, wird das erste Tabellenblatt der Datei verwendet.

Avro-Tabellendefinitionen erstellen

Wenn Sie eine Avro-Datei als externe Datenquelle verwenden, ruft BigQuery das Schema automatisch über die Quelldaten ab. Sie müssen beim Erstellen einer Tabellendefinition für Avro-Dateien keine automatische Schemaerkennung verwenden und keine Inline-Schemadefinition bzw. Schemadatei angeben.

Sie können eine Tabellendefinitionsdatei für Avro-Daten erstellen, die in Cloud Storage oder Google Drive gespeichert sind.

So erstellen Sie mithilfe der Befehlszeile eine Tabellendefinitionsdatei für Avro-Daten:

  1. Mit dem Befehl mkdef des Befehlszeilentools können Sie eine Tabellendefinition erstellen. Das Flag --noautodetect müssen Sie für Avro-Dateien nicht verwenden. Die automatische Schemaerkennung ist für Avro-Dateien deaktiviert. Der Befehl mkdef erzeugt eine Tabellendefinitionsdatei im JSON-Format. Im folgenden Beispiel wird eine Tabellendefinition erstellt und die Ausgabe in eine Datei geschrieben – /tmp/file_name.

    Ersetzen Sie im Befehl Folgendes:

    • uri mit Ihrem Cloud Storage-URI oder Ihrem Google Drive-URI. Beispiel: https://drive.google.com/open?id=123ABCD123AbcD123Abcd für Google Drive oder gs://mybucket/myfile für Cloud Storage.
    • file_name mit dem Namen Ihrer Tabellendefinitionsdatei.
    bq mkdef \
    --source_format=AVRO \
    "uri" > /tmp/file_name
    
  2. (Optional) Öffnen Sie die Tabellendefinitionsdatei in einem Texteditor. Mit dem Befehl nano /tmp/file_name wird die Datei z. B. in Nano geöffnet. Die Datei sollte wie unten dargestellt aussehen. Die Einstellung "autodetect" ist in diesem Fall nicht erforderlich.

    {
    "sourceFormat": "AVRO",
    "sourceUris": [
      "uri"
    ]
    }
    
  3. (Optional) Bearbeiten Sie die Tabellendefinitionsdatei manuell, um allgemeine Einstellungen wie maxBadRecords und ignoreUnknownValues zu ändern, hinzuzufügen oder zu löschen. Es gibt keine Konfigurationseinstellungen speziell für Avro-Quelldateien, aber es gibt Einstellungen, die für CSV- und Google Tabellen-Dateien gelten. Weitere Informationen finden Sie in der API-Referenz unter ExternalDataConfiguration.

Tabellendefinitionen aus Cloud Datastore- und Cloud Firestore-Exporten erstellen

Wenn Sie einen Cloud Datastore- oder Cloud Firestore-Export als externe Datenquelle verwenden, ruft BigQuery das Schema automatisch aus den selbstbeschreibenden Quelldaten ab. Sie müssen beim Erstellen einer Tabellendefinition für Cloud Datastore- und Cloud Firestore-Sicherungsdateien keine automatische Schemaerkennung verwenden und keine Inline-Schemadefinition bzw. Schemadatei angeben.

Sie können eine Tabellendefinitionsdatei für Cloud Datastore und Cloud Firestore-Exportdaten erstellen, die in Cloud Storage gespeichert sind.

So erstellen Sie mithilfe der Befehlszeile eine Tabellendefinitionsdatei für Cloud Datastore- oder Cloud Firestore-Exportdaten:

  1. Mit dem Befehl mkdef des Befehlszeilentools können Sie eine Tabellendefinition erstellen. Bei Cloud Datastore- oder Cloud Firestore-Sicherungsdateien müssen Sie das Flag --noautodetect nicht verwenden. Die automatische Schemaerkennung ist für diese Dateitypen deaktiviert. Der Befehl mkdef erzeugt eine Tabellendefinitionsdatei im JSON-Format. Im folgenden Beispiel wird eine Tabellendefinition erstellt und die Ausgabe in eine Datei geschrieben – /tmp/file_name.

    Ersetzen Sie im Befehl Folgendes:

    • bucket_uri mit Ihrem Cloud Storage-URI.
    • file_name mit dem Namen Ihrer Tabellendefinitionsdatei.

    Beachten Sie, dass das DATASTORE_BACKUP-Quellformat sowohl für Cloud Datastore als auch für Cloud Firestore verwendet wird.

    bq mkdef \
    --source_format=DATASTORE_BACKUP \
    "uri" > /tmp/file_name
    
  2. (Optional) Öffnen Sie die Tabellendefinitionsdatei in einem Texteditor. Mit dem Befehl nano /tmp/file_name wird die Datei z. B. in Nano geöffnet. Die Datei sollte wie unten dargestellt aussehen. Die Einstellung "autodetect" ist in diesem Fall nicht erforderlich.

    {
    "sourceFormat": "DATASTORE_BACKUP",
    "sourceUris": [
      "gs://bucket_uri"
    ]
    }
    
  3. (Optional) Bearbeiten Sie die Tabellendefinitionsdatei manuell, um Einstellungen wie maxBadRecords und ignoreUnknownValues zu ändern, hinzuzufügen oder zu löschen. Es gibt keine spezifischen Konfigurationseinstellungen für Cloud Datastore- und Cloud Firestore-Exportdateien. Es gibt jedoch Einstellungen, die für CSV- und Google Tabellen-Dateien gelten. Weitere Informationen finden Sie in der API-Referenz unter ExternalDataConfiguration.

Cloud Bigtable-Tabellendefinitionen erstellen

Eine Tabellendefinitionsdatei für Cloud Bigtable erstellen Sie manuell im JSON-Format. Der Befehl mkdef zum Erstellen einer Tabellendefinition wird für Cloud Bigtable-Datenquellen derzeit nicht unterstützt. Auch die automatische Schemaerkennung wird für Cloud Bigtable nicht unterstützt. Eine Liste der Optionen für Cloud Bigtable-Tabellendefinitionen finden Sie in der REST API-Referenz unter BigtableOptions.

Ein Beispiel für eine JSON-Tabellendefinitionsdatei für Cloud Bigtable sehen Sie unten. Mit dieser Tabellendefinitionsdatei liest BigQuery Daten aus einer einzelnen Spaltenfamilie und interpretiert dabei die Werte als binär codierte Ganzzahlen.

{
    "sourceFormat": "BIGTABLE",
    "sourceUris": [
        "https://googleapis.com/bigtable/projects/project_id/instances/instance_id/tables/table_name"
    ],
    "bigtableOptions": {
        "columnFamilies" : [
            {
                "familyId": "family_int",
                "type": "INTEGER",
                "encoding": "BINARY"
            }
        ],
    }
}

Unterstützung von Platzhaltern für Tabellendefinitionsdateien

Wenn Ihre Cloud Storage-Daten in mehrere Dateien mit einem gemeinsamen Basisnamen aufgeteilt sind, können Sie im URI in der Tabellendefinitionsdatei einen Platzhalter verwenden. Dazu hängen Sie ein Sternchen (*) an den Basisnamen an und setzen den Bucket und den Dateinamen in Anführungszeichen. Beispiel: Bei zwei Dateien namens fed- sample000001.csv und fed-sample000002.csv wäre der Bucket-URI "gs://mybucket/fed-sample*".

Sie können nur einen Platzhalter für Objekte (Dateinamen) in Ihrem Bucket verwenden. Der Platzhalter kann innerhalb oder am Ende des Objektnamens stehen. Das Anhängen eines Platzhalters an den Bucketnamen wird nicht unterstützt.

Für Cloud Bigtable-Daten kann nur ein URI angegeben werden. Er muss eine vollständige und gültige HTTPS-URL für eine Cloud Bigtable-Tabelle sein. Für Cloud Datastore-Sicherungen kann nur ein URI angegeben werden, der auf .backup_info enden muss.

Das Platzhalterzeichen * ist nicht zulässig, wenn Tabellendefinitionsdateien für Folgendes erstellt werden:

  • Cloud Bigtable-Datenquellen
  • In Cloud Storage gespeicherte Cloud Datastore-Exporte
  • In Cloud Storage gespeicherte Cloud Firestore-Exporte
  • In Google Drive gespeicherte Daten
Hat Ihnen diese Seite weitergeholfen? Teilen Sie uns Ihr Feedback mit:

Feedback geben zu...