BigQuery-Übersicht

BigQuery ist eine vollständig verwaltete, KI-fähige Datenplattform, mit der Sie Ihre Daten mit integrierten Funktionen wie maschinellem Lernen, Suche, raumbezogenen Analysen und Business Intelligence verwalten und analysieren können. Dank der serverlosen Architektur von BigQuery können Sie mithilfe von Sprachen wie SQL und Python die größten Fragen Ihrer Organisation ohne Infrastrukturverwaltung beantworten.

BigQuery bietet eine einheitliche Möglichkeit, sowohl mit strukturierten als auch mit unstrukturierten Daten zu arbeiten. Außerdem werden offene Tabellenformate wie Apache Iceberg, Delta und Hudi unterstützt. BigQuery-Streaming unterstützt die kontinuierliche Datenaufnahme und -analyse. Mit der skalierbaren, verteilten Analyse-Engine von BigQuery können Sie Terabyte in Sekunden und Petabyte in Minuten abfragen.

Die Architektur von BigQuery besteht aus zwei Teilen: einer Speicherebene, die Daten aufnimmt, speichert und optimiert, und einer Rechenebene, die Analysefunktionen bietet. Diese Rechen- und Speicherebenen funktionieren dank des Petabit-Netzwerks von Google, das die erforderliche Kommunikation zwischen ihnen ermöglicht, effizient unabhängig voneinander.

Legacy-Datenbanken müssen in der Regel Ressourcen für Lese- und Schreibvorgänge sowie analytische Vorgänge gemeinsam nutzen. Dies kann zu Ressourcenkonflikten führen und Abfragen verlangsamen, während Daten in den Speicher geschrieben oder aus diesem gelesen werden. Freigegebene Ressourcenpools können weiter überlastet werden, wenn Ressourcen für Datenbankverwaltungsaufgaben wie das Zuweisen oder Widerrufen von Berechtigungen erforderlich sind. Durch die Trennung von Computing- und Speicherebenen in BigQuery kann jede Ebene Ressourcen dynamisch zuweisen, ohne die Leistung oder Verfügbarkeit der anderen Ebene zu beeinträchtigen.

Die BigQuery-Architektur trennt Ressourcen durch das Petabit-Netzwerk.

Dieses Prinzip der Trennung ermöglicht eine schnellere Innovation von BigQuery, da Speicher- und Computing-Verbesserungen unabhängig voneinander ohne Ausfallzeiten oder negative Auswirkungen auf die Systemleistung bereitgestellt werden können. Außerdem ist es wichtig, ein vollständig verwaltetes serverloses Data Warehouse anzubieten, in dem das BigQuery-Entwicklerteam Updates und Wartungen durchführt. Dadurch müssen Sie keine Ressourcen bereitstellen oder manuell skalieren, sodass Sie sich auf die Wertschöpfung statt auf herkömmliche Datenbankverwaltungsaufgaben konzentrieren können.

Zu den BigQuery-Schnittstellen gehören die Google Cloud Console-Oberfläche und das BigQuery-Befehlszeilentool. Entwickler und Data Scientists können Clientbibliotheken mit vertrauter Programmierung wie Python, Java, JavaScript und Go sowie die REST API und RPC API von BigQuery zum Transformieren und Verwalten von Daten verwenden. ODBC- und JDBC-Treiber ermöglichen die Interaktion mit vorhandenen Anwendungen, einschließlich Tools und Dienstprogrammen von Drittanbietern.

Als Data Analyst, Data Engineer, Data Warehouse Administrator oder Data Scientist können Sie mit BigQuery Daten laden, verarbeiten und analysieren, um wichtige Geschäftsentscheidungen zu treffen.

Jetzt mit BigQuery starten

Sie können in wenigen Minuten anfangen, BigQuery kennenzulernen. Nutzen Sie die kostenlose Nutzungsstufe oder die kostenlose Sandbox von BigQuery, um mit dem Laden und Abfragen von Daten zu beginnen.

  1. BigQuery-Sandbox: Einstieg in die BigQuery-Sandbox ohne Risiko und kostenlos.
  2. Kurzanleitung zur Google Cloud Console: Machen Sie sich mit der Leistungsfähigkeit der BigQuery Console vertraut.
  3. Öffentliche Datasets: Machen Sie sich mit der Leistung von BigQuery vertraut, indem Sie große reale Daten aus dem Programm für öffentliche Datasets untersuchen.

BigQuery kennenlernen

Mit der serverlosen Infrastruktur von BigQuery können Sie sich auf Ihre Daten statt auf die Ressourcenverwaltung konzentrieren. BigQuery kombiniert ein cloudbasiertes Data Warehouse mit leistungsstarken Analysetools.

BigQuery-Speicher

BigQuery speichert Daten in einem spaltenorientierten Format, das für analytische Abfragen optimiert ist. BigQuery stellt Daten in Tabellen, Zeilen und Spalten bereit und bietet vollständige Unterstützung für die Semantik von Datenbanktransaktionen (ACID). Der BigQuery-Speicher wird automatisch über mehrere Standorte repliziert, um eine hohe Verfügbarkeit zu ermöglichen.

Weitere Informationen finden Sie unter BigQuery-Speicher.

BigQuery-Analysen

Deskriptive und präskriptive Analysen umfassen Business Intelligence, Ad-hoc-Analysen, Raumbezogene Analysen und maschinelles Lernen. Sie können in BigQuery gespeicherte Daten abfragen oder Abfragen für Daten an deren Speicherort ausführen, indem Sie externe Tabellen oder föderierten Abfragen verwenden, einschließlich Google Cloud Storage, Bigtable, Spanner oder Google Sheets, die in Google Drive gespeichert sind.

  • ANSI-Standard-SQL-Abfragen (SQL:2011-Unterstützung), einschließlich Unterstützung für Joins, verschachtelte und wiederkehrende Felder, Analyse- und Aggregationsfunktionen, Abfragen mit mehreren Anweisungen und einer Vielzahl von räumlichen Funktionen mit raumbezogenen Analysen – geografische Informationssysteme.
  • Ansichten erstellen, um Ihre Analyse freizugeben.
  • Unterstützung von Business Intelligence-Tools, einschließlich BI Engine mit Looker Studio, Looker, Google Sheets und Tools von Drittanbietern wie Tableau und Power BI.
  • BigQuery ML bietet maschinelles Lernen und Analysen zu Prognosezwecken.
  • BigQuery Studio bietet Features wie Python-Notebooks sowie Versionsverwaltung für Notebooks und gespeicherte Abfragen. Mit diesen Features können Sie die Datenanalyse- und ML-Workflows in BigQuery einfacher ausführen.
  • Daten außerhalb von BigQuery mit externen Tabellen und föderierten Abfragen abfragen.

Weitere Informationen finden Sie unter BigQuery-Analysen.

BigQuery-Verwaltung

BigQuery bietet eine zentralisierte Verwaltung von Daten- und Rechenressourcen und Identity and Access Management (IAM) unterstützt Sie dabei, diese Ressourcen mithilfe des Zugriffsmodells zu schützen, das in Google Cloud verwendet wird. Best Practices von Google Cloud für die Sicherheit bieten einen soliden, aber auch flexiblen Ansatz, der herkömmliche Perimetersicherheit oder einen komplexeren und detaillierteren Ansatz mit gestaffelten Sicherheitsebenen umfassen kann.

  • Die Einführung in die Datensicherheit und Governance hilft Ihnen, die Data Governance zu verstehen und zu steuern, welche Kontrollen Sie für die Sicherung von BigQuery-Ressourcen benötigen könnten.
  • Jobs sind Aktionen, die BigQuery für Sie ausführt, um Daten zu laden, zu exportieren, abzufragen oder zu kopieren.
  • Mit Reservierungen können Sie zwischen On-Demand-Preisen und kapazitätsbasierten Preisen wechseln.

Weitere Informationen finden Sie unter Einführung in BigQuery.

BigQuery-Ressourcen

Sehen Sie sich die BigQuery-Ressourcen an:

APIs, Tools und Referenzen

Referenzmaterialien für BigQuery-Entwickler und -Analysten:

BigQuery-Rollen und -Ressourcen

BigQuery erfüllt die Anforderungen von Datenexperten in den folgenden Rollen und Verantwortlichkeiten.

Datenanalyst

Eine Anleitung für Aufgaben, wenn Sie Folgendes tun müssen:

Klicken Sie auf Tour starten, um die Datenanalysefeatures von BigQuery direkt in der Google Cloud Console kennenzulernen.

Tour ansehen

Datenadministrator

Eine Anleitung für Aufgaben, wenn Sie Folgendes tun müssen:

Weitere Informationen finden Sie unter Einführung in die BigQuery-Verwaltung.

Klicken Sie auf Tour starten, um die BigQuery-Datenverwaltungsfunktionen direkt in der Google Cloud Console kennenzulernen.

Tour ansehen

Data Scientist

Eine Anleitung für Aufgaben, wenn Sie das maschinelle Lernen von BigQuery ML für Folgendes verwenden müssen:

Datenentwickler

Eine Anleitung für Aufgaben, wenn Sie Folgendes tun müssen:

BigQuery-Videoanleitungen

Die folgende Reihe von Videoanleitungen bietet einen Einstieg in BigQuery:

Titel

Beschreibung

Erste Schritte mit BigQuery (17:18) Übersicht über BigQuery und seine Verwendung Das Segment umfasst ETL-Pipelines, Preisgestaltung und Optimierung, BigQuery ML und BI Engine und die Demo mit BigQuery in der Google Cloud Console.
Was ist BigQuery? (4:39) Übersicht über BigQuery und darüber, wie BigQuery für die Aufnahme und Speicherung großer Datenmengen entwickelt wurde, um Analysten und Entwicklern gleichermaßen zu helfen
BigQuery-Sandbox verwenden (3:05) BigQuery-Sandbox einrichten, mit der Sie Abfragen ohne Kreditkarte ausführen können
Fragen stellen und Abfragen ausführen (5:11) SQL-Abfragen in der BigQuery-UI schreiben und ausführen – einschließlich der Auswahl siegreichen Trikotnummer
Daten in BigQuery laden (5:31) Daten in Echtzeit aufnehmen und analysieren oder einfach eine einmalige Batchanalyse von Daten – plus Katzen und Hunde
Abfrageergebnisse visualisieren (5:38) Inwiefern Datenvisualisierung nützlich ist, um komplexe Datasets leichter und besser zu verstehen
Zugriff mit IAM verwalten (5:23) Anderen Nutzern mit IAM-Berechtigungen und Zugriffssteuerung erlauben, Ihre Datasets in BigQuery abzufragen
Abfragen speichern und teilen (6:17) Abfragen problemlos in BigQuery speichern und freigeben
Vertrauliche Daten mit autorisierten Ansichten schützen (7:12) Datasets einfach für verschiedene Nutzer freigeben, indem Sie benutzerdefinierte Zugriffssteuerungen festlegen
Externe Daten mit BigQuery abfragen (5:49) Externe Datenquelle in BigQuery einrichten und Daten aus Cloud Storage, Cloud SQL, Google Drive usw. abfragen
Was sind benutzerdefinierte Funktionen? (4:59) Benutzerdefinierte Funktionen (UDFs) zum Analysieren von Datasets in BigQuery erstellen

Nächste Schritte