Diese Seite wurde von der Cloud Translation API übersetzt.

BigQuery-Übersicht

BigQuery ist eine vollständig verwaltete, KI-fähige Datenplattform, mit der Sie Ihre Daten mit integrierten Funktionen wie maschinellem Lernen, Suche, raumbezogenen Analysen und Business Intelligence verwalten und analysieren können. Dank der serverlosen Architektur von BigQuery können Sie mithilfe von Sprachen wie SQL und Python die größten Fragen Ihrer Organisation ohne Infrastrukturverwaltung beantworten.

BigQuery bietet eine einheitliche Möglichkeit, sowohl mit strukturierten als auch mit unstrukturierten Daten zu arbeiten, und unterstützt offene Tabellenformate wie Apache Iceberg, Delta und Hudi. BigQuery-Streaming unterstützt die kontinuierliche Datenerfassung und -analyse. Mit der skalierbaren, verteilten Analyse-Engine von BigQuery können Sie Terabyte in Sekunden und Petabyte in Minuten abfragen.

BigQuery bietet integrierte Verwaltungsfunktionen, mit denen Sie Daten ermitteln und kuratieren sowie Metadaten und Datenqualität verwalten können. Mit Funktionen wie der semantischen Suche und der Datenherkunft können Sie relevante Daten für die Analyse finden und validieren. Sie können Daten und KI-Assets in Ihrer gesamten Organisation freigeben und dabei von der Zugriffssteuerung profitieren. Diese Funktionen basieren auf dem Dataplex Universal Catalog, einer einheitlichen, intelligenten Governance-Lösung für Daten- und KI-Assets in Google Cloud.

Die Architektur von BigQuery besteht aus zwei Teilen: einer Speicherebene, die Daten aufnimmt, speichert und optimiert, und einer Rechenebene, die Analysefunktionen bietet. Diese Rechen- und Speicherebenen funktionieren dank des Petabit-Netzwerks von Google, das die erforderliche Kommunikation zwischen ihnen ermöglicht, effizient unabhängig voneinander.

Legacy-Datenbanken müssen in der Regel Ressourcen für Lese- und Schreibvorgänge sowie für analytische Vorgänge gemeinsam nutzen. Dies kann zu Ressourcenkonflikten führen und Abfragen verlangsamen, während Daten in den Speicher geschrieben oder aus diesem gelesen werden. Freigegebene Ressourcenpools können weiter überlastet werden, wenn Ressourcen für Datenbankverwaltungsaufgaben wie das Zuweisen oder Widerrufen von Berechtigungen erforderlich sind. Durch die Trennung von Computing- und Speicherebenen in BigQuery kann jede Ebene Ressourcen dynamisch zuweisen, ohne die Leistung oder Verfügbarkeit der anderen Ebene zu beeinträchtigen.

Die BigQuery-Architektur trennt Ressourcen durch das Petabit-Netzwerk.

Dieses Prinzip der Trennung ermöglicht eine schnellere Innovation von BigQuery, da Speicher- und Computing-Verbesserungen unabhängig voneinander ohne Ausfallzeiten oder negative Auswirkungen auf die Systemleistung bereitgestellt werden können. Außerdem ist es wichtig, ein vollständig verwaltetes serverloses Data Warehouse anzubieten, in dem das BigQuery-Entwicklerteam Updates und Wartungen durchführt. Dadurch müssen Sie keine Ressourcen bereitstellen oder manuell skalieren, sodass Sie sich auf die Wertschöpfung statt auf herkömmliche Datenbankverwaltungsaufgaben konzentrieren können.

Zu den BigQuery-Schnittstellen gehören die Google Cloud Console-Oberfläche und das BigQuery-Befehlszeilentool. Entwickler und Data Scientists können Clientbibliotheken mit vertrauter Programmierung wie Python, Java, JavaScript und Go sowie die REST API und RPC API von BigQuery zum Transformieren und Verwalten von Daten verwenden. ODBC- und JDBC-Treiber ermöglichen die Interaktion mit vorhandenen Anwendungen, einschließlich Tools und Dienstprogrammen von Drittanbietern.

Als Data Analyst, Data Engineer, Data Warehouse Administrator oder Data Scientist können Sie mit BigQuery Daten laden, verarbeiten und analysieren, um wichtige Geschäftsentscheidungen zu treffen.

Jetzt mit BigQuery starten

Sie können in wenigen Minuten anfangen, BigQuery kennenzulernen. Nutzen Sie die kostenlose Nutzungsstufe oder die kostenlose Sandbox von BigQuery, um mit dem Laden und Abfragen von Daten zu beginnen.

BigQuery-Sandbox: Einstieg in die BigQuery-Sandbox ohne Risiko und kostenlos.
Google Cloud Kurzanleitung zur Console: Machen Sie sich mit der Leistungsfähigkeit von BigQuery Studio vertraut.
Öffentliche Datasets: Machen Sie sich mit der Leistung von BigQuery vertraut, indem Sie große reale Daten aus dem Programm für öffentliche Datasets untersuchen.

BigQuery kennenlernen

Mit der serverlosen Infrastruktur von BigQuery können Sie sich auf Ihre Daten statt auf die Ressourcenverwaltung konzentrieren. BigQuery kombiniert ein cloudbasiertes Data Warehouse mit leistungsstarken Analysetools.

BigQuery-Speicher

BigQuery speichert Daten in einem spaltenorientierten Format, das für analytische Abfragen optimiert ist. BigQuery stellt Daten in Tabellen, Zeilen und Spalten bereit und bietet vollständige Unterstützung für die Semantik von Datenbanktransaktionen (ACID). Der BigQuery-Speicher wird automatisch über mehrere Standorte repliziert, um eine hohe Verfügbarkeit zu ermöglichen.

Erfahren Sie mehr über gängige Muster zum Organisieren von BigQuery-Ressourcen im Data Warehouse und in Data-Marts.
Weitere Informationen zu Datasets, dem übergeordneten Container von BigQuery für Tabellen und Ansichten.
Der BigQuery Data Transfer Service automatisiert die Datenaufnahme.
Laden Sie Daten in BigQuery mit:
- Stream-Daten mit der Storage Write API.
- Im Batch geladenen Daten aus lokalen Dateien oder Cloud Storage mit Formaten wie Avro, Parquet, ORC, CSV, JSON, Datastore und Firestore.

Weitere Informationen finden Sie unter BigQuery-Speicher.

BigQuery-Analysen

Deskriptive und präskriptive Analysen umfassen Business Intelligence, Ad-hoc-Analysen, Raumbezogene Analysen und maschinelles Lernen. Sie können in BigQuery gespeicherte Daten abfragen oder Abfragen für Daten an deren Speicherort ausführen, indem Sie externe Tabellen oder föderierten Abfragen verwenden, einschließlich Google Cloud Storage, Bigtable, Spanner oder Google Sheets, die in Google Drive gespeichert sind.

ANSI-Standard-SQL-Abfragen (SQL:2011-Unterstützung), einschließlich Unterstützung für Joins, verschachtelte und wiederkehrende Felder, Analyse- und Aggregationsfunktionen, Abfragen mit mehreren Anweisungen und einer Vielzahl von räumlichen Funktionen mit raumbezogenen Analysen – geografische Informationssysteme.
Ansichten erstellen, um Ihre Analyse freizugeben.
Unterstützung von Business Intelligence-Tools, einschließlich BI Engine mit Looker Studio, Looker, Google Sheets, und Tools von Drittanbietern wie Tableau und Power BI.
BigQuery ML bietet maschinelles Lernen und Analysen zu Prognosezwecken.
BigQuery Studio bietet Features wie Python-Notebooks sowie Versionsverwaltung für Notebooks und gespeicherte Abfragen. Mit diesen Features können Sie die Datenanalyse- und ML-Workflows in BigQuery einfacher ausführen.
Daten außerhalb von BigQuery mit föderierten Abfragen undexternen Tabellen abfragen.

Weitere Informationen finden Sie unter BigQuery-Analysen.

BigQuery-Verwaltung

BigQuery bietet eine zentrale Verwaltung von Daten- und Rechenressourcen und Identity and Access Management (IAM) unterstützt Sie dabei, diese Ressourcen mithilfe des Zugriffsmodells zu schützen, das in Google Cloudverwendet wird. Google Cloud Sicherheits-Best Practices bieten einen soliden, aber flexiblen Ansatz, der Perimeter-Sicherheit oder einen komplexeren und detaillierterenDefense-in-Depth-Ansatz umfassen kann.

Die Einführung in die Datensicherheit und Governance hilft Ihnen, die Data Governance zu verstehen und zu steuern, welche Kontrollen Sie für die Sicherung von BigQuery-Ressourcen benötigen könnten.
Jobs sind Aktionen, die BigQuery für Sie ausführt, um Daten zu laden, zu exportieren, abzufragen oder zu kopieren.
Mit Reservierungen können Sie zwischen On-Demand-Preisen und kapazitätsbasierten Preisen wechseln.

Weitere Informationen finden Sie unter Einführung in BigQuery.

BigQuery-Ressourcen

Sehen Sie sich die BigQuery-Ressourcen an:

Versionshinweise enthalten Änderungslogs mit Features, Änderungen und verworfenen Funktionen.
Preise für Analyse und Speicherung. Weitere Informationen finden Sie in den Preisen für BigQuery ML, BI Engine und Data Transfer Service.
Standorte definieren, wo Sie Datasets erstellen (und regionale und multiregionale Standorte).
Stack Overflow hostet eine interessierte Community von Entwicklern und Analysten, die mit BigQuery arbeiten.
Der BigQuery-Support bietet Hilfe für BigQuery.
Google BigQuery: The Definitive Guide: Data Warehousing, Analytics, and Machine Learning at Scale von Valliappa Lakshmanan und Jordan Tigani erläutert, wie BigQuery funktioniert, und bietet eine ausführliche Anleitung zur Nutzung des Dienstes.

APIs, Tools und Referenzen

Referenzmaterialien für BigQuery-Entwickler und -Analysten:

Die BigQuery API und die Clientbibliotheken bieten einen Überblick über die Features von BigQuery und deren Verwendung.
SQL-Abfragesyntax für Details zur Verwendung von GoogleSQL.
BigQuery-Codebeispiele bieten Hunderte von Snippets für Clientbibliotheken in C#, Go, Java, Node.js, Python und Ruby. Sie können sich auch den Beispielbrowser ansehen.
Mit der Syntax von DML, DDL> und benutzerdefinierten Funktionen (UDFs)können Sie BigQuery-Daten verwalten und transformieren.
In der bq-Befehlszeilentool-Referenz werden die Syntax, Befehle, Flags und Argumente für die bq-Befehlszeile dokumentiert.
ODBC/JDBC-Integration verbindet BigQuery mit Ihren vorhandenen Tools und Infrastrukturen.

Gemini in BigQuery-Funktionen

Gemini in BigQuery ist Teil der Produktfamilie Gemini für Google Cloud, die KI-basierte Unterstützung bietet, die Ihnen die Arbeit mit Ihren Daten erleichtert.

Gemini in BigQuery bietet KI-Unterstützung, um Ihnen bei Folgendem zu helfen:

Daten mit Data Insights analysieren und nachvollziehen: Data Insights bietet eine automatisierte, intuitive Möglichkeit, Muster zu erkennen und statistische Analysen durchzuführen. Dazu werden aussagekräftige Abfragen verwendet, die aus den Metadaten Ihrer Tabellen generiert werden. Diese Funktion ist besonders hilfreich bei der Bekämpfung von Kaltstartproblemen bei der frühen explorativen Datenanalyse. Weitere Informationen finden Sie unter Data Insights in BigQuery generieren.
Daten mit dem BigQuery-Daten-Canvas identifizieren, transformieren, abfragen und visualisieren: Mit Gemini in BigQuery können Sie mit der natürlichen Sprache Tabellen-Assets suchen, zusammenführen und abfragen, Ergebnisse visualisieren und während des gesamten Vorgangs nahtlos mit anderen zusammenarbeiten. Weitere Informationen finden Sie unter Mit Data Canvas analysieren.
Unterstützte SQL- und Python-Datenanalyse nutzen: Mit Gemini in BigQuery können Sie Code in SQL oder Python generieren oder vorschlagen lassen und eine vorhandene SQL-Abfrage erläutern lassen. Sie können auch Abfragen in natürlicher Sprache ausführen, um mit der Datenanalyse zu beginnen. Informationen zum Generieren, Vervollständigen und Zusammenfassen von Code finden Sie in der folgenden Dokumentation:
- SQL Code Assist
- Python Code Assist
Daten für die Analyse vorbereiten: Die Datenvorbereitung in BigQuery bietet kontextbezogene, KI-generierte Transformationsempfehlungen zum Bereinigen von Daten für die Analyse. Weitere Informationen finden Sie unter Daten mit Gemini vorbereiten.
SQL-Übersetzungen mit Übersetzungsregeln anpassen: (Vorschau) Erstellen Sie Gemini-optimierte Übersetzungsregeln, um Ihre SQL-Übersetzungen anzupassen, wenn Sie den interaktiven SQL-Übersetzer verwenden. Sie können Änderungen der SQL-Übersetzungsausgabe mit Prompts mit natürlicher Sprache beschreiben oder SQL-Muster zum Suchen und Ersetzen angeben. Weitere Informationen finden Sie unter Übersetzungsregel erstellen.

Informationen zum Einrichten von Gemini in BigQuery finden Sie unter Gemini in BigQuery einrichten.

BigQuery-Rollen und -Ressourcen

BigQuery erfüllt die Anforderungen von Datenexperten in den folgenden Rollen und Verantwortlichkeiten.

Datenanalyst

Eine Anleitung für Aufgaben, wenn Sie Folgendes tun müssen:

BigQuery-Daten abfragen – mit interaktiven oder Batch-Abfragen mithilfe der SQL-Abfragesyntax
SQL-Funktionen, Operatoren und bedingte Ausdrücke zum Abfragen von Daten verwenden
Verwenden Sie Tools, um BigQuery-Daten zu analysieren und zu visualisieren, einschließlich Looker, Looker Studio und Google Sheets.
Raumbezogene Analysen verwenden, um raumbezogene Daten mit den geografischen Informationssystemen von BigQuery zu analysieren und zu visualisieren
Abfrageleistung optimieren mit:
- Partitionierten Tabellen: Große Tabellen anhand von Zeit- oder Ganzzahlbereichen bereinigen
- Materialisierten Ansichten: Im Cache gespeicherte Ansichten definieren, um Abfragen zu optimieren oder persistente Ergebnisse zu liefern
- BI Engine: Der schnelle In-Memory-Analysedienst von BigQuery

Klicken Sie auf Tour starten, um die Datenanalysefunktionen von BigQuery direkt in der Google Cloud Console kennenzulernen.

Tour ansehen

Datenadministrator

Eine Anleitung für Aufgaben, wenn Sie Folgendes tun müssen:

Verwalten Sie Kosten mit Reservierungen, um On-Demand- und kapazitätsbasierte Preise auszubalancieren.
Datensicherheit und Governance verstehen, um Daten nach Dataset, Tabelle, Spalte, Zeile oder Ansicht zu schützen
Daten mit Tabellen-Snapshots sichern, um den Inhalt einer Tabelle zu einem bestimmten Zeitpunkt aufzubewahren
BigQuery INFORMATION_SCHEMA ansehen, um die Metadaten von Datasets, Jobs, Zugriffssteuerung, Reservierungen, Tabellen und mehr zu verstehen.
Jobs verwenden, um mit BigQuery Daten zu laden, zu exportieren, abzufragen oder zu kopieren
Logs und Ressourcen überwachen, um BigQuery und Arbeitslasten zu verstehen

Weitere Informationen finden Sie unter Einführung in die BigQuery-Verwaltung.

Klicken Sie auf Tour starten, um die BigQuery-Datenverwaltungsfunktionen direkt in der Google Cloud -Konsole kennenzulernen.

Tour ansehen

Data Scientist

Eine Anleitung für Aufgaben, wenn Sie das maschinelle Lernen von BigQuery ML für Folgendes verwenden müssen:

End-to-End-Nutzerpfad für Modelle für maschinelles Lernen verstehen
Zugriffssteuerung für BigQuery ML verwalten
BigQuery ML-Modelle erstellen und trainieren, einschließlich:
- Prognostizieren der linearen Regression
- Binäre logistische und mehrklassige logistische Regressionsklassifizierungen
- K-Means-Clustering zur Datensegmentierung
- Zeitachsenprognosen mit Arima+-Modellen

Datenentwickler

Eine Anleitung für Aufgaben, wenn Sie Folgendes tun müssen:

Daten in BigQuery laden mit:
- Im Batch geladenen Daten für die Formate Avro, Parquet, ORC, CSV, JSON, Datastore und Firestore
- BigQuery Data Transfer Service
- BigQuery Storage Write API
Codebeispielbibliothek verwenden, einschließlich Folgendem:
Google Cloud -Beispielbrowser (für BigQuery)
Übersicht über APIs und Bibliotheken
ODBC/JDBC-Integration

BigQuery-Videoanleitungen

Die folgende Reihe von Videoanleitungen bietet einen Einstieg in BigQuery:

Titel	Beschreibung
Erste Schritte mit BigQuery (17:18)	Übersicht über BigQuery und seine Verwendung Das Segment umfasst ETL-Pipelines, Preisgestaltung und Optimierung, BigQuery ML und BI Engine und die Demo mit BigQuery in der Google Cloud -Konsole.
Was ist BigQuery? (4:39)	Übersicht über BigQuery und darüber, wie BigQuery für die Aufnahme und Speicherung großer Datenmengen entwickelt wurde, um Analysten und Entwicklern gleichermaßen zu helfen
BigQuery-Sandbox verwenden (3:05)	BigQuery-Sandbox einrichten, mit der Sie Abfragen ohne Kreditkarte ausführen können
Fragen stellen und Abfragen ausführen (5:11)	SQL-Abfragen in der BigQuery-UI schreiben und ausführen – einschließlich der Auswahl siegreichen Trikotnummer
Daten in BigQuery laden (5:31)	Daten in Echtzeit aufnehmen und analysieren oder einfach eine einmalige Batchanalyse von Daten – plus Katzen und Hunde
Abfrageergebnisse visualisieren (5:38)	Inwiefern Datenvisualisierung nützlich ist, um komplexe Datasets leichter und besser zu verstehen
Zugriff mit IAM verwalten (5:23)	Anderen Nutzern mit IAM-Berechtigungen und Zugriffssteuerung erlauben, Ihre Datasets in BigQuery abzufragen
Abfragen speichern und teilen (6:17)	Abfragen problemlos in BigQuery speichern und freigeben
Vertrauliche Daten mit autorisierten Ansichten schützen (7:12)	Datasets für verschiedene Nutzer freigeben, indem Sie benutzerdefinierte Zugriffssteuerungen festlegen
Externe Daten mit BigQuery abfragen (5:49)	Externe Datenquelle in BigQuery einrichten und Daten aus Cloud Storage, Cloud SQL, Google Drive usw. abfragen
Was sind benutzerdefinierte Funktionen? (4:59)	Benutzerdefinierte Funktionen (UDFs) zum Analysieren von Datasets in BigQuery erstellen

Nächste Schritte

Eine Übersicht über BigQuery-Speicher finden Sie in der Übersicht über BigQuery-Speicher.
Eine Übersicht über BigQuery-Abfragen finden Sie unter BigQuery-Analysen.
Eine Übersicht über die BigQuery-Verwaltung finden Sie unter Einführung in die BigQuery-Verwaltung.
Eine Übersicht über die BigQuery-Sicherheit finden Sie unter Datensicherheit und Data Governance.