Überlegungen zum Google Cloud-Systemdesign

In diesem Abschnitt des Architektur-Frameworks werden Google Cloud-Funktionen und -Dienste erläutert, die Sie auf unterschiedliche Weise kombinieren können, um die Bereitstellung an Ihre geschäftlichen Anforderungen anzupassen.

Das Framework umfasst die folgenden Artikel:

Geografische Zonen und Regionen

Regionen sind unabhängige geografische Gebiete, die aus mehreren Zonen bestehen. Eine Zone ist ein Bereitstellungsbereich für Google Cloud-Ressourcen innerhalb einer Region. Zonen sollten als einzelne Fehlerdomain betrachtet werden. Zur Bereitstellung fehlertoleranter Anwendungen mit Hochverfügbarkeit stellen Sie Ihre Anwendungen in mehreren Zonen einer einzelnen Region oder in mehreren Zonen verschiedener Regionen bereit, um erwartete und unerwartete Ausfallzeiten zu vermeiden.

Google Cloud-Dienste und -Ressourcen können zonal, regional oder global sein oder von Google in mehreren Regionen verwaltet werden:

Zonale Ressourcen

Zonale Ressourcen arbeiten innerhalb einer einzigen Zone. Wenn eine Zone nicht mehr verfügbar ist, sind auch die Ressourcen in dieser Zone bis zur Wiederherstellung des Dienstes nicht verfügbar. Virtuelle Maschinen (VMs) und lokale nichtflüchtige Speicher (Persistent Disks, PDs) sind Beispiele für zonale Ressourcen.

Regionale Ressourcen

Regionale Ressourcen werden redundant in allen Zonen einer Region bereitgestellt. Dadurch haben sie eine höhere Verfügbarkeit als zonale Ressourcen. App Engine- und regionale Cloud Storage-Buckets sind Beispiele für regionale Ressourcen.

Multiregionale Ressourcen

Google-Dienste sind redundant und innerhalb einer Region oder über mehrere Regionen verteilt. Diese Dienste optimieren die Verfügbarkeit, die Leistung und die Ressourceneffizienz. Daher sind Kompromisse zwischen Latenz und Konsistenz erforderlich. Diese Kompromisse werden produktspezifisch dokumentiert.

Globale Ressourcen

Google-Dienste sind redundant und innerhalb einer Region oder über mehrere Regionen verteilt. Diese Dienste sind nicht an eine bestimmte Region oder Gruppe von Regionen gebunden. Load-Balancer, Pub/Sub und Spracherkennung sind Beispiele für globale Ressourcen.

Fragen zum Design

  • In welchen geografischen Regionen befinden sich die Nutzer Ihrer Anwendungen?
  • Welche Google Cloud-Regionen sind Ihren Nutzern am nächsten?
  • Haben Sie geografische Vorschriften?
  • Benötigen Sie eine globale Bereitstellung oder genügt für Ihre Anforderungen eine regionale Bereitstellung?

Empfehlungen

  • Wählen Sie eine Region oder eine Gruppe von Regionen aus, die Ihren Endnutzern geografisch am nächsten liegt, um die Latenz beim Bereitstellen von Traffic für externe Nutzer zu minimieren.
  • Wählen Sie eine bestimmte Region oder eine Gruppe von Regionen aus, um geografischen Anforderungen zu erfüllen.
  • Verwenden Sie einen Load-Balancer, um eine einzelne IP-Adresse bereitzustellen, die an Ihre Anwendung weitergeleitet wird, wenn Sie Nutzer in der ganzen Welt haben.
  • Verbinden Sie Ihre lokalen Netzwerke oder Colocations-Netzwerke über Cloud Interconnect mit Google Cloud, um private Hochgeschwindigkeits-Netzwerkverbindungen zu ermöglichen.

Ressourcen

Ressourcenverwaltung

Google Cloud bietet Ressourcencontainer wie Organisationen, Ordner und Projekte, mit denen Sie Google Cloud-Ressourcen gruppieren und hierarchisch organisieren können. Mit dieser hierarchischen Organisation können Sie relevante Aspekte Ihrer Ressourcen verwalten, z. B. Zugriffssteuerung, Konfigurationseinstellungen und Richtlinien. Resource Manager bietet programmatischen Zugriff auf die Ressourcencontainer.

Das folgende Diagramm zeigt die Google Cloud-Ressourcenhierarchie:

Google Cloud-Ressourcenhierarchie

Die Google Cloud-Ressourcenhierarchie hat zwei Ziele:

  • Sie stellt eine Hierarchie von Inhaberschaften zur Verfügung, in der der Lebenszyklus einer Ressource an das in der Hierarchie unmittelbar übergeordnete Element gebunden ist.
  • Sie ermöglicht das Zuweisen und Übernehmen von Zugriffssteuerungs- und Organisationsrichtlinien.

Mit der Google Cloud-Ressourcenhierarchie können Sie Ihre Organisationsstruktur in Google Cloud zuordnen. Die Hierarchie bietet auch logische Verbindungspunkte für IAM-Richtlinien (Identity and Access Management, Identitäts- und Zugriffsverwaltung) zur Verwaltung des Zugriffs auf Ressourcen sowie Organisationsrichtlinien. Sowohl IAM- als auch Organisationsrichtlinien werden innerhalb der Hierarchie übernommen. Die auf jedem Hierarchieknoten geltende Richtlinie resultiert aus auf den Knoten angewendeten und von Ancestors übernommenen Richtlinien.

Die Ressourcen auf der untersten Ebene stellen die grundlegenden Komponenten aller Google Cloud-Dienste dar. Beispiele für Ressourcen sind virtuelle Compute Engine-Maschinen (VMs), Pub/Sub-Themen, Cloud Storage-Buckets und App Engine-Instanzen. Alle diese untergeordneten Ressourcen müssen in einem Projekt vorhanden sein. Projekte stellen die erste Gruppenebene der Google Cloud-Ressourcenhierarchie dar.

Der Organisationsknoten befindet sich ganz oben in der Hierarchie und hat kein übergeordnetes Element. Alle Ressourcen, die zu einer Organisation gehören, werden unter dem Organisationsknoten gruppiert. Der Organisationsknoten ermöglicht die zentrale Sichtbarkeit und Steuerung aller Ressourcen einer Organisation.

Als weiterer Gruppierungsmechanismus sind Projekten Ordner übergeordnet. Sie benötigen eine Organisationsressource, um Ordner erstellen zu können.

Fragen zum Design

  • Welche Rollen in Ihrer Organisation erfordern Zugriff auf Ihre Google Cloud-Infrastruktur?
  • Welche Zugriffsanforderungen haben die Mitglieder der einzelnen Rollen für Google Cloud-Ressourcen?
  • Wie wird Ihre Organisationsstruktur mit der Google Cloud-Ressourcenhierarchie implementiert?
  • Haben Sie Governance-Konventionen für das Bezeichnen von Ressourcen?

Empfehlungen

  • Erstellen Sie in Ihrer Domain einen Organisationsknoten.
  • Definieren Sie eine Ressourcenhierarchie, die Ihren Google Cloud-Geschäftsanforderungen entspricht.
  • Definieren Sie Ihre Projektstruktur. Beispiele:
    • Anonymisieren Sie Informationen in Projektnamen.
    • Verwenden Sie ein Projektnamensmuster wie {Anfängliche-Unternehmens-ID}-{Umgebung}-{App-Name}, wobei die Platzhalter eindeutig sind, aber keine Namen von Unternehmen oder Anwendungen erkennen lassen.
  • Automatisieren Sie die Projekterstellung, delegieren Sie die Abrechnung und richten Sie die IAM-Governance ein.
  • Sie können versehentliches Löschen verhindern, indem Sie Projektsperren nutzen.
  • Identifizieren und planen Sie die zonale, regionale und multiregionale Bereitstellung für Ihre Arbeitslasten.

Ressourcen

Identitäts- und Zugriffsverwaltung

Die Identitäts- und Zugriffsverwaltung ist ein Grundpfeiler Ihrer Google Cloud-Bereitstellung, da sie die Autorisierungskontrollen für Google Cloud-Ressourcen bietet. Mit IAM können Sie Mitarbeiter, Kunden und andere Identitäten sowie deren jeweilige Zugriffsberechtigungen verwalten.

Google Cloud bietet Ihnen eine Reihe von IAM-Diensten für Unternehmen, mit denen Sie den Zugriff auf Ihre Daten sichern, die Verwaltung durch intelligente Funktionen vereinfachen und mit Zuversicht in die Cloud wechseln können.

In IAM gewähren Sie Mitgliedern Zugriff. Folgende Arten von Mitgliedern sind zulässig:

Google-Konto

Ein Google-Konto stellt einen Entwickler, einen Administrator oder eine andere Person dar, die mit Google Cloud interagiert.

Dienstkonto

Ein Dienstkonto ist ein Konto, das zu einer Anwendung und nicht einem einzelnen Endnutzer gehört.

Google-Gruppe

Eine Google-Gruppe ist eine benannte Sammlung von Google-Konten und Dienstkonten.

G Suite-Domain

Eine G Suite-Domain repräsentiert eine virtuelle Gruppe aller Google-Konten, die im G Suite-Konto einer Organisation erstellt wurden.

Cloud Identity-Domain

Eine Cloud Identity-Domain ähnelt einer G Suite-Domain, weil sie eine virtuelle Gruppe aller Google-Konten in einer Organisation repräsentiert.

Autorisierung

Wenn ein authentifiziertes Mitglied versucht, auf eine Ressource zuzugreifen, prüft IAM anhand der IAM-Richtlinie der Ressource, ob die Aktion zulässig ist. Die für den Autorisierungsprozess relevanten Entitäten und Konzepte werden unten beschrieben.

Ressourcen

Sie können Nutzern Zugriff auf eine Google Cloud-Ressource gewähren. Beispiele für Ressourcen sind Projekte, Compute Engine-Instanzen und Cloud Storage-Buckets. Manche Dienste, z. B. Compute Engine und Cloud Storage, unterstützen die Zuweisung von IAM-Berechtigungen mit einer höheren Genauigkeit, als es auf Projektebene möglich ist.

Berechtigungen

Berechtigungen bestimmen, welche Vorgänge bei einer Ressource zulässig sind. Bei IAM werden Berechtigungen so dargestellt: service.resource.verb. Sie weisen Nutzern Berechtigungen nicht direkt zu. Stattdessen weisen Sie ihnen eine Rolle zu, die eine oder mehrere Berechtigungen enthält.

Rollen

Eine Rolle ist eine Sammlung von Berechtigungen. Wenn Sie einem Nutzer eine Rolle zuweisen, erhält er alle mit ihr verknüpften Berechtigungen. In IAM gibt es drei Arten von Rollen:

  • Einfache Rollen: Inhaber, Bearbeiter und Betrachter.
  • Vordefinierte Rollen: Vordefinierte Rollen sind IAM-Rollen, die eine präzisere Zugriffssteuerung als einfache Rollen ermöglichen.
  • Benutzerdefinierte Rollen: Dies sind Rollen, die Sie erstellen, um Berechtigungen an die Anforderungen Ihrer Organisation anzupassen, wenn diese durch vordefinierte Rollen nicht erfüllt werden.

IAM-Richtlinien

Sie können Nutzern Rollen zuweisen, indem Sie IAM-Richtlinien erstellen. Dabei handelt es sich um Festlegungen, mit denen der Zugriff für verschiedene Personen zugewiesen wird. Richtlinien werden mit einer Ressource verbunden und erfordern eine Zugriffssteuerung, wenn auf diese Ressource zugegriffen wird. Eine IAM-Richtlinie wird durch das IAM-Richtlinienobjekt repräsentiert.

Richtlinienhierarchie

Sie können IAM-Richtlinien auf jeder Ebene der Ressourcenhierarchie festlegen: auf Organisations-, Ordner-, Projekt- oder Ressourcenebene. Ressourcen übernehmen die Richtlinien der übergeordneten Ressource. Legen Sie eine Richtlinie auf Organisationsebene fest, wenn sie automatisch von allen untergeordneten Ordnern und Projekten übernommen werden soll. Legen Sie eine Richtlinie auf Projektebene fest, wenn sie von allen untergeordneten Ressourcen des Projekts übernommen werden soll. Die geltende Richtlinie für eine Ressource ist die Kombination aus der für diese Ressource festgelegten Richtlinie und der Richtlinie, die von weiter oben in der Hierarchie übernommen wird.

Fragen zum Design

  • Wie verwalten Sie Identitäten?
  • Stellen Sie eine Verbindung von einer vorhandenen Identitätsquelle her?
  • Wie möchten Sie den Administratorzugriff delegieren?
  • Haben Sie einen Governance-Prozess, um die Zugriffssteuerung zu erstellen, zu aktualisieren und zu prüfen?
  • Gruppieren Sie Nutzer und erzwingen Sie die Multi-Faktor-Authentifizierung (MFA) basierend auf Datenschutz für den Zugriff?

Empfehlungen

  • Sichern Sie den Administratorzugriff für die Organisation.
  • Verbinden Sie Identitätsanbieter mit Google Cloud.
  • Verwenden Sie Cloud Identity für die Nutzerkontenidentität, wenn Sie keinen Identitätsanbieter haben.
  • Verwenden Sie Google-Konten und geeignete IAM-Richtlinien für jeden Nutzer.
  • Erstellen Sie Ihre eigenen benutzerdefinierten Dienstkonten, um bei IAM-Berechtigungen das Prinzip der geringsten Berechtigung zu berücksichtigen.
  • Migrieren Sie nicht verwaltete Konten.
  • Sichern Sie den Zugriff auf Ressourcen mithilfe des Prinzips der geringsten Berechtigung.
  • Verwenden Sie Gruppen und Dienstkonten.
  • Verwenden Sie eine Namenskonvention für Gruppen.
  • Prüfen Sie den Anfrage-Workflow für die Gruppenmitgliedschaft.
  • Erzwingen Sie MFA, wann immer möglich, insbesondere für Nutzer mit umfassenden Zugriffsberechtigungen.
  • Prüfen Sie den Super Admin-Zugriff.
  • Nutzen Sie das Dienstkonto und prüfen Sie den Zugriff und seine Verwendung.
  • Entfernen Sie die standardmäßigen IAM-Organisationsrichtlinien.
  • Prüfen Sie regelmäßig Änderungen der Zugriffsverwaltung.

Wichtige Dienste

Cloud Identity ermöglicht die Identitäts-, Anwendungs- und Geräteverwaltung, um die Nutzereffizienz zu maximieren, Unternehmensdaten zu schützen und in Ihrem Unternehmen einen digitalen Arbeitsbereich einzuführen.

Identity Platform fügt Ihren Anwendungen und Diensten Funktionen zur Identitäts- und Zugriffsverwaltung hinzu und hilft so beim Schutz von Nutzerkonten.

Managed Service for Microsoft Active Directory (AD) verwaltet Ihre AD-abhängigen Arbeitslasten, automatisiert die AD-Serverwartung und -Sicherheitskonfiguration und verbindet Ihre lokale AD-Domain über einen hochverfügbaren, gehärteten Google Cloud-Dienst mit der Cloud.

Ressourcen

Konzepte | IAM-Dokumentation
Ressourcenhierarchie für Zugriffssteuerung verwenden | IAM-Dokumentation

Compute

Die meisten Lösungen verwenden in irgendeiner Form Rechenressourcen und die Auswahl von Rechenressourcen für Ihre Anwendungsanforderungen ist von entscheidender Bedeutung. In Google Cloud werden Rechenressourcen über Compute Engine, App Engine, Google Kubernetes Engine (GKE), Cloud Functions und Cloud Run angeboten. Sie sollten Ihre Anwendungsanforderungen analysieren und dann eines der folgenden Computing-Angebote auswählen.

Compute Engine bietet GPUs, die Sie Ihren VM-Instanzen hinzufügen können. Sie können diese GPUs nutzen, um bestimmte Arbeitslasten wie maschinelles Lernen und Datenverarbeitung auf Ihren Instanzen zu beschleunigen.

Normalerweise eignet sich App Engine hervorragend zum Hosten von Front-End-Anwendungen, da Sie sich damit auf die Anwendungsentwicklung konzentrieren können, statt sich um die Verwaltung der Infrastruktur kümmern zu müssen. App Engine unterstützt auch die Containerbereitstellung, was die Migration vereinfacht und beschleunigt. App Engine unterstützt das Hosten von Mikrodienstarchitekturen mit mehreren Diensten.

Wenn Sie mehr administrative Kontrolle benötigen, ist Google Kubernetes Engine zu empfehlen. GKE eignet sich hervorragend für komplexe Mikrodienstarchitekturen, die zusätzliche Dienste wie Istio für die Service Mesh-Steuerung benötigen.

Wenn weder App Engine noch GKE Ihre Anforderungen erfüllen, können Sie zum Bereitstellen Ihrer Anwendung Compute Engine verwenden, da Sie damit beliebige benutzerdefinierte VM-Images erstellen und ausführen können.

Mit Cloud Functions können Sie Automatisierungscode erstellen, der für eine kurze Zeit gültig ist und auf skalierbare Weise Aktionen ausführen kann. Mit Cloud Functions können Sie verschiedene Teile Ihrer Anwendungen zusammenfügen, ohne sich um die Verwaltung der Infrastruktur kümmern zu müssen.

Fragen zum Design

  • Wie haben Sie vor, Rechenressourcen einsetzen?
  • Sind Ihre Anwendungen containerisiert oder bestehen alte Abhängigkeiten?
  • Ist Ihre Anwendung zustandsorientiert oder zustandslos?
  • Haben Sie eine komplexe verteilte Dienstbereitstellung (Netzwerk zwischen Knoten)?
  • Wie wird der Instanzzugriff verwaltet (einschließlich SSH-Schlüsseln)?

Empfehlungen

  • Wählen Sie die Google Cloud-Region aus, die Ihren Nutzern am nächsten ist oder am besten den Compliance-Anforderungen entspricht.
  • Prüfen Sie die Latenzanforderungen für Ihre Arbeitslasten.
  • Bestimmen Sie die Latenzanforderungen für Endnutzer der Anwendung und wählen Sie eine Bereitstellungsstrategie mit einer oder mehreren Regionen aus.
  • Achten Sie darauf, dass Instanzen nicht für die Verwendung des Standarddienstkontos mit uneingeschränktem Zugriff auf alle Cloud APIs konfiguriert sind.
  • Achten Sie darauf, dass die IP-Weiterleitung für Instanzen nur aktiviert ist, wenn es erforderlich ist.
  • Achten Sie darauf, dass Compute Engine-Instanzen keine öffentlichen IP-Adressen haben, wenn es nicht erforderlich ist. Verwenden Sie stattdessen ein NAT-Gateway.

Wichtige Dienste

Compute Engine stellt virtuelle Maschinen bereit, die in den innovativen Rechenzentren und im globalen Glasfasernetzwerk von Google ausgeführt werden. Die Compute Engine-Tools ermöglichen die Skalierung von einzelnen Instanzen bis hin zu einer globalen Infrastruktur mit Load-Balancing. Compute Engine-VMs starten schnell, bieten effiziente Optionen für nichtflüchtige Speicher und lokale Laufwerke und liefern eine konsistente Leistung. Unsere virtuellen Server sind in vielen Konfigurationen verfügbar. Unter anderem gibt es vordefinierte Größen und Optionen zum Erstellen benutzerdefinierter Maschinentypen, die für Ihre spezifischen Anforderungen optimiert sind. Dank flexibler Preise und automatischer Rabatte für kontinuierliche Nutzung kann Compute Engine Ihre konkreten Preis- und Leistungsanforderungen erfüllen.

Google Kubernetes Engine bietet einen leistungsfähigen Clustermanager und ein Orchestrierungssystem zum Ausführen von Docker-Containern. GKE organisiert Ihre Container im Cluster, hält sie fehlerfrei und verwaltet sie automatisch entsprechend den von Ihnen definierten Anforderungen, z. B. in Bezug auf CPU und Arbeitsspeicher. GKE basiert auf Kubernetes, dem Open-Source-System zur Containerorchestrierung. Mithilfe einer Open-Source-Plattform erhalten Sie die Flexibilität, Ihre Container in GKE, lokal oder in einer anderen öffentlichen Cloud-Infrastruktur bereitzustellen. GKE bietet Ihnen eine verwaltete Kubernetes-Steuerungsebene, mit der Sie sich auf die Entwicklung von Anwendungen konzentrieren können und die Ihnen die Verwaltung von Kubernetes-Deployment erleichtert. GKE unterstützt Sie beim Bereitstellen von zonalen oder regionalen Clustern entsprechend Ihren Anforderungen und unterstützt gleichzeitig private Cluster und Knative.

App Engine ist eine Plattform für das Erstellen von skalierbaren Webanwendungen sowie mobilen und IoT-Back-Ends. Die integrierten Dienste und APIs von App Engine, z. B. NoSQL-Datenspeicher, Memcache und eine API zur Nutzerauthentifizierung, sind in den meisten Anwendungen vorhanden. App Engine kann Ihre Anwendung automatisch entsprechend dem empfangenen Traffic skalieren, sodass Sie nur für die tatsächlich genutzten Ressourcen zahlen. Sie laden einfach Ihren Code hoch und Google kümmert sich um die Verfügbarkeit Ihrer Anwendung, sodass Sie keinen einzigen Server bereitstellen oder verwalten müssen.

Cloud Functions ist eine serverlose Ausführungsumgebung zum Erstellen und Verbinden von Cloud-Diensten. Mit Cloud Functions schreiben Sie einfache Funktionen, die einem einzigen Zweck dienen und an Ereignisse gebunden sind, die von Ihrer Cloud-Infrastruktur und Ihren Diensten ausgegeben werden. Die Funktion wird ausgelöst, wenn ein überwachtes Ereignis initiiert wird. Ihr Code wird in einer vollständig verwalteten Umgebung ausgeführt. Sie müssen keine Infrastruktur bereitstellen und sich auch nicht um die Verwaltung von Servern kümmern.

Cloud Run ist eine verwaltete Computing-Plattform, mit der Sie zustandslose Container ausführen können, die sich über Webanfragen oder Pub/Sub-Ereignisse aufrufen lassen. Cloud Run arbeitet serverlos und benötigt keine Infrastrukturverwaltung. So können Sie sich ganz auf das Programmieren von Anwendungen konzentrieren. Mit dieser auf Knative basierenden Plattform können Sie Container wahlweise vollständig verwaltet mit Cloud Run oder in Ihrem GKE-Cluster mit Cloud Run for Anthos on Google Cloud ausführen.

Ressourcen

Netzwerk

Das private Netzwerk von Google verbindet unsere regionalen Standorte mit mehr als 100 Netzwerk-Points-of-Presence weltweit. Google Cloud verwendet softwarebasierte Netzwerke und verteilte Systeme, um Ihre Dienste zu hosten und weltweit so schnell wie möglich bereitzustellen. Die globale VPC von Google nutzt das globale Hochgeschwindigkeitsnetzwerk von Google, um Ihre Anwendungen regionenübergreifend privat und zuverlässig zu verknüpfen. Jede Millisekunde an Latenz zählt und Google sorgt mit Innovationen wie BBR Congestion Control Intelligence dafür, dass Ihre Inhalte mit höchstem Durchsatz bereitgestellt werden.

Das Netzwerkdesign ist eine weitere wichtige Komponente, die dabei helfen kann, die Leistung zu optimieren und die Kommunikation Ihrer Anwendung mit internen und externen Diensten zu sichern. Wenn Sie sich für Netzwerkdienste entscheiden, müssen Sie einige Schritte im Hinblick auf Ihre Anwendungsanforderungen und die Art berücksichtigen, auf die Anwendungen miteinander kommunizieren. Einige Komponenten erfordern einen globalen Dienst, während andere auf eine bestimmte Region beschränkt bleiben müssen. Wählen Sie eine Bereitstellungsregion in der Nähe Ihrer Nutzer, um eine bessere Leistung zu erzielen.

Fragen zum Design

  • Wie komplex ist Ihr System zur Bereitstellung der Anwendungsdienstkonnektivität?
  • Welche Netzwerkanforderungen gelten für Ihre anwendungsübergreifenden Bereitstellungen?
  • Wie stellen Sie dann eine Verbindung zum Google Cloud-Netzwerk her, wenn Sie externe Dienste nutzen?
  • Wie viel Bandbreite benötigen Sie, wenn Sie Ihre VPC mit dem lokalen Netzwerk verbinden?
  • Wie segmentieren Ihr Netzwerk und steuern den Zugriff darin? Basierend auf Anwendungen? Basierend auf Teams?
  • Haben Sie einen Governance-Prozess, um neue Netzwerk-Deployment zu erstellen oder vorhandene zu aktualisieren? Wie oft führen Sie Prüfungen durch?
  • Haben Sie ein separates Netzwerk für vertrauliche Anwendungen? Wie überwachen und beschränken Sie den Zugriff?

Empfehlungen

  • Dokumentieren Sie das Netzwerkdesign: projektübergreifende oder Hybridbereitstellungen. Verwenden Sie ein Netzwerktopologiediagramm, um die Verbindung zu prüfen.
  • Verwenden Sie klare und konsistente Namenskonventionen für Dienste wie Dienstkonten, Netzwerk-Tags und Firewallregeln.
  • Weisen Sie auf Subnetzebene die Rolle "Netzwerknutzer" zu.
  • Wählen Sie ein geeignetes Projekt aus:
    • Verwenden Sie nur ein Hostprojekt, wenn Ressourcen mehrere Netzwerkschnittstellen erfordern.
    • Erstellen Sie eine einzelne VPC pro Projekt, um Projekten VPC-Kontingente zuzuordnen.
    • Verwenden Sie mehrere Hostprojekte, wenn Ressourcenanforderungen das Kontingent eines einzelnen Projekts überschreiten.
    • Verwenden Sie mehrere Hostprojekte, wenn für jede VPC separate Verwaltungsrichtlinien benötigt werden.
  • Erstellen Sie für jedes unabhängige Team eine VPC, mit freigegebenen Diensten in einer gemeinsamen VPC.
  • Isolieren Sie vertrauliche Daten in einer eigenen VPC oder einem eigenen Projekt.
  • Achten Sie bei der Verwendung von VPC-Netzwerk-Peering darauf, dass Sie nicht die entsprechenden Kontingentlimits (Weiterleitungsregeln, Firewallregeln, Routen usw.) überschreiten.
  • Steuern Sie mit virtuellen Appliances mit mehreren NICs den Traffic zwischen VPCs über ein Cloud-Gerät.
  • Verwenden Sie VPC für die Verwaltung mehrerer Arbeitsgruppen.
  • Erstellen Sie eine VPC mit freigegebenen Diensten, wenn mehrere VPCs Zugriff auf freigegebene Ressourcen, aber nicht aufeinander benötigen.
  • Verwenden Sie nach Möglichkeit dynamisches Routing.
  • Zentralisieren Sie die Netzwerksteuerung.
  • Verwenden Sie für die Namensauflösung nach Möglichkeit private DNS-Zonen.
  • Prüfen Sie häufig die Berechtigungen und die Steuerung des Netzwerkzugriffs.
  • Achten Sie darauf, dass der SSH/RDP-Zugriff über das Internet eingeschränkt ist.
  • Aktivieren Sie VPC-Flusslogs für kritische Projekte.

Wichtige Dienste

Virtual Private Cloud (VPC) bietet Netzwerkfunktionen für Compute Engine-VM-Instanzen, GKE-Cluster und flexible App Engine-Instanzen. VPC stellt globale, skalierbare und flexible Netzwerke für Ihre cloudbasierten Dienste bereit. Ein VPC-Netzwerk ist eine globale Ressource und besteht aus regionalen virtuellen Subnetzwerken (Subnetzen) in Rechenzentren, die über ein globales Wide Area Network (WAN) verbunden sind. VPC-Netzwerke sind in Google Cloud logisch voneinander isoliert.

Eine freigegebene VPC ermöglicht einer Organisation, Ressourcen von mehreren Projekten mit einem gemeinsamen VPC-Netzwerk zu verbinden, sodass sie sicher und effizient über interne IP-Adressen dieses Netzwerks miteinander kommunizieren können. Wenn Sie eine freigegebene VPC verwenden, bestimmen Sie ein Projekt zum Hostprojekt und fügen ihm ein oder mehrere Dienstprojekte hinzu. Die VPC-Netzwerke im Hostprojekt werden als freigegebene VPC-Netzwerke bezeichnet.

Cloud Load Balancing bietet Ihnen die Möglichkeit, Rechenressourcen mit Load-Balancing in einer oder mehreren Regionen zu verteilen, um Ihre Hochverfügbarkeitsanforderungen zu erfüllen, Ihre Ressourcen hinter einer einzelnen Anycast-IP-Adresse zu platzieren und Ihre Ressourcen durch intelligentes Autoscaling vertikal oder horizontal zu skalieren. Cloud Load Balancing ist vollständig auf Cloud CDN abgestimmt und ermöglicht so eine optimale Inhaltsübermittlung. Google Cloud bietet sowohl globale und regionale als auch interne Load-Balancer, damit Sie die Bereitstellung Ihrer Anwendung optimieren können.

Cloud CDN (Content Delivery Network) verwendet global verteilte Edge Points of Presence von Google, um Inhalte mit HTTP(S)-Load-Balancing in Nutzernähe im Cache zu speichern. Durch das Caching von Inhalten am Rand des Google-Netzwerks werden Inhalte schneller für Nutzer bereitgestellt und gleichzeitig die Bereitstellungskosten gesenkt.

Cloud DNS ist ein skalierbarer, zuverlässiger, verwalteter Dienst für ein autoritatives Domain Name System (DNS), der auf der Infrastruktur von Google ausgeführt wird. Er bietet niedrige Latenz, Hochverfügbarkeit und eine kostengünstige Möglichkeit, Anwendungen und Dienste für Ihre Nutzer bereitzustellen.

Cloud Interconnect erweitert Ihr lokales Netzwerk über eine hochverfügbare Verbindung mit niedriger Latenz auf das Google-Netzwerk. Die Verbindung zu Google kann mithilfe von Cloud Interconnect – Dedicated (Dedicated Interconnect) direkt oder mithilfe von Cloud Interconnect – Partner (Partner Interconnect) über einen unterstützten Dienstanbieter hergestellt werden.

Ressourcen

Speicher

Die meisten Bereitstellungen benötigen Speicher für ihre Daten. Google Cloud-Dienste können in Blob-Speicher und Laufwerkspeicher unterteilt werden. Da der Speicher über das Netzwerk mit anderen Diensten verbunden ist, sollten Sie bei der Auswahl des Speichertyps auch die IOPS-Anforderungen berücksichtigen. In Google Cloud ist IOPS-Wert mit dem Speicher verknüpft und wird entsprechend dem bereitgestellten Speicherplatz skaliert. Einige Speichertypen wie Persistent Disk erfordern eine manuelle Replikation und Sicherung, da sie zonal oder regional sind. Cloud Storage repliziert Daten nativ in den ausgewählten Regionen und ist hochverfügbar.

Wenn Sie Google Cloud-Speicheroptionen prüfen, sehen Sie sich Cloud Storage für Blobs, Persistent Disk für Blockspeicher und Filestore für freigegebene Dateien an. Cloud Storage ist eine regionale oder multiregionale Ressource. Alle Cloud Storage-Buckets haben eine integrierte Redundanz, um ihre Daten vor Geräteausfällen zu schützen und die Verfügbarkeit der Daten während Wartungsarbeiten im Rechenzentrum aufrechtzuerhalten. Für alle Cloud Storage-Vorgänge werden Prüfsummen berechnet, um sicherzustellen, dass die gelesenen Daten mit den geschriebenen übereinstimmen. Persistent Disk ist eine zonale oder regionale Ressource. Daher müssen Sie zusätzliche Schritte ausführen, um Snapshots Ihrer Daten zu erstellen, die Daten zu sichern oder sie für Redundanz zu replizieren.

Es hat sich bewährt, bei der Auswahl eines Speichertyps die Anforderungen an die Anwendungsleistung und die Datenanforderungen zu ermitteln.

Fragen zum Design

  • Wie viel und welche Arten von Speicher benötigen Sie?
  • Welche Zugriffsmodi gibt es für Ihre Anforderungen?
  • Benötigen Sie aktiven Speicher oder Archivspeicher?
  • Möchten Sie statische Objekte für das Webhosting hosten? CDN?
  • Werden sensible Daten gespeichert und verarbeitet? Wie wird der Zugriff überwacht und verwaltet?
  • Gibt es Prozess- und Governance-Anforderungen für die Verschlüsselung?

Empfehlungen

  • Bestimmen Sie die Speicheranforderungen für Anwendungen und wählen Sie entsprechend geeignete Speicheroptionen aus.
  • Achten Sie darauf, dass jeder Bucket-Name im gesamten Cloud Storage-Namespace eindeutig ist. Der Bucket-Name darf keine vertraulichen Informationen enthalten. Wählen Sie Bucket- und Objektnamen, die schwer zu erraten sind.
  • Kalkulieren Sie ungefähr die Menge an Traffic, die an Cloud Storage gesendet wird, damit Sie die Übertragungszeit berechnen können.
  • Wenn Sie öffentliche Inhalte hosten, verwenden Sie CDN, um die Kosten für ausgehenden Traffic zu minimieren.
  • Speichern Sie die Daten in der Region, die den Nutzern der Anwendung am nächsten ist.
  • Berücksichtigen Sie bei der Wahl des Standorts für Nutzerdaten die Compliance-Anforderungen.
  • Verwenden Sie für Daten, die mit hoher Rate und Hochverfügbarkeit bereitgestellt werden, die Klasse "Multi-Regional Storage" oder "Regional Storage". Verwenden Sie für Daten, auf die selten zugegriffen wird und für die eine etwas geringere Verfügbarkeit genügt, die Klasse "Nearline Storage" oder "Coldline Storage".
  • Achten Sie darauf, dass Ihr Cloud Storage-Bucket weder anonym noch öffentlich zugänglich ist.

Wichtige Dienste

Mit Cloud Storage können Sie jederzeit beliebige Datenmengen weltweit speichern und abrufen. Sie können Cloud Storage für verschiedene Aufgaben verwenden, beispielsweise das Bereitstellen von Websiteinhalten, das Speichern von Daten für die Archivierung und Notfallwiederherstellung oder das Verteilen großer Datenobjekte an Nutzer über direkte Downloads.

Cloud Storage bietet vier Speicherklassen: "Multi-Regional Storage", "Regional Storage", "Nearline Storage" und "Coldline Storage". Alle Speicherklassen bieten eine niedrige Latenz (die Zeit bis zum ersten Byte beträgt normalerweise einige zehn Millisekunden) und eine hohe Langlebigkeit. Die Klassen unterscheiden sich in der jeweiligen Verfügbarkeit, der Mindestspeicherdauer und den Speicher- und Zugriffspreisen.

Persistent Disk ist ein langlebiger, leistungsfähiger Blockspeicher für Google Cloud. Persistent Disk bietet SSD- und HDD-Speicher, der an Instanzen angehängt werden kann, die entweder in Compute Engine oder in Google Kubernetes Engine ausgeführt werden. Speicher-Volumes können schnell gesichert werden und unterstützen mehrere Leser gleichzeitig. Außerdem lässt sich ihre Größe transparent anpassen.

Regionale nichtflüchtige Speicher bieten eine dauerhafte Speicherung und Replikation von Daten zwischen zwei Zonen in derselben Region. Wenn Sie einen höheren IOPS-Wert und eine niedrige Latenz benötigen, bietet Google Cloud dafür lokale SSDs. Diese sind physisch mit dem Server verbunden, der Ihre VM-Instanz hostet. Sie können sie als temporären Speicherplatz verwenden.

Filestore ist ein verwalteter Dateispeicherdienst für Anwendungen, die eine Dateisystemschnittstelle und ein freigegebenes Dateisystem für Daten benötigen. Filestore bietet Nutzern eine einfache, native Bereitstellung von verwaltetem Network Attached Storage (NAS) für ihre Compute Engine- und Google Kubernetes Engine-Instanzen. Leistung und Kapazität von Filestore lassen sich unabhängig voneinander optimieren, was zu einer konsistent hohen Leistung bei dateibasierten Arbeitslasten führt.

Ressourcen

Datenbank

Die Auswahl einer Datenbank ist ein weiterer wichtiger Schritt bei der Auswahl von Komponenten für Ihre Anwendung. Bei Datenbanken wird grob zwischen relationalen und nicht relationalen Datenbanken unterschieden. Sie können mithilfe virtueller Compute Engine-Maschinen (VMs) Ihre eigene Datenbank oder Ihren eigenen Datenbankcluster hosten. Sie sollten jedoch verwaltete Datenbankdienste von Google Cloud in Betracht ziehen, bevor Sie eigene installieren. Die Verwaltung Ihrer eigenen Datenbank oder Ihres eigenen Datenbankclusters ist mit einem zusätzlichen Verwaltungsaufwand für die neuesten Patches und Updates verbunden. Gleichzeitig müssen auch die alltäglichen operativen Aktivitäten wie das Monitoring und das Erstellen von Sicherungen erledigt werden. Google Cloud bietet Ihnen eine große Auswahl an Datenbankdiensten entsprechend dem geschäftlichen Anwendungsfall. Auswahlkriterien sind beispielsweise Zugriff mit niedriger Latenz, die Verarbeitung von Zeitachsendaten, die Notfallwiederherstellung oder die Synchronisierung mobiler Clients. Cloud SQL ist ein regionaler Dienst, der Lesereplikate in entfernten Regionen, Lesevorgänge mit niedriger Latenz und Notfallwiederherstellung unterstützt. Cloud Spanner ist ein multiregionales Angebot, das externe Konsistenz, globale Replikation und ein SLA mit einer Verfügbarkeit von 99,999 % umfasst. Weitere Systeme sind Bigtable, Memorystore, Firebase und Firestore. Open-Source-Datenbanken wie MongoDB und MariaDB sind ebenfalls verfügbar.

Ähnlich wie bei der Speicherung können Sie sich bei der Datenbankauswahl nach Ihren funktionalen und nicht funktionalen Anwendungsanforderungen richten. Bestimmen Sie die Anforderungen und wählen Sie die Datenbank aus, die sie am besten erfüllt.

Wenn Sie vorhandene Arbeitslasten in Google Cloud verschieben, brauchen Sie eine Datenbankmigrationstechnologie, die eine Migration ohne Ausfallzeiten ermöglicht. Dies ist nötig, damit Anwendungen während einer laufenden Datenbankmigration weiterhin den Endnutzern zur Verfügung stehen. Sie können zwischen verschiedenen Technologien zur Datenbankmigration wählen.

Fragen zum Design

  • Welche Datenbanken werden ausgeführt? Wie werden sie verwendet?
  • Haben Sie spezifische Anforderungen (Latenz, Replikation, Konsistenz)?
  • Gibt es Legacy-Abhängigkeiten bezüglich bestimmter Datenbanken oder Versionen?
  • Wie viele der Datenbanken sind strukturiert bzw. unstrukturiert?
  • Wie wird der Zugriff auf Ihre Datenbank gesteuert? Auf Anwendungsebene und für die internen Nutzung?

Empfehlungen

  • Wählen Sie das richtige Schema für Ihre Tabelle aus.
  • Wählen Sie den richtigen Schlüsselnamen, um Überlastung von Schlüsseln zu vermeiden, insbesondere bei nicht relationalen Datenbanken.
  • Fragmentieren Sie Ihre Datenbankinstanz, wenn möglich.
  • Greifen Sie auf Best Practices für das Verbindungsmanagement zurück, z. B. Verbindungs-Pooling und exponentiellen Backoff.
  • Vermeiden Sie sehr große Transaktionen.
  • Konfigurieren und testen Sie die Reaktion Ihrer Anwendung auf Wartungsupdates für Datenbanken.
  • Sichern und isolieren Sie die Verbindungen zu Ihrer Datenbank.

Cloud SQL-spezifische Empfehlungen:

  • Verwenden Sie ein privates IP-Netzwerk (VPC).

    • Für zusätzliche Sicherheit:
      • Verwenden Sie den Cloud SQL-Proxy mit privatem Netzwerk.
      • Schränken Sie den Zugriff über öffentliche IP-Adressen ein (constraints/sql.restrictPublicIp).
  • Wenn Sie ein öffentliches IP-Netzwerk benötigen:

    • Verwenden Sie die integrierte Firewall mit eingeschränkter IP-Liste und achten Sie darauf, dass eingehende Verbindungen auf Cloud SQL-Instanzen nur über SSL möglich sind.
    • Für zusätzliche Sicherheit:
      • Setzen Sie nichts auf die weiße Liste und verwenden Sie den Cloud SQL-Proxy.
      • Schränken Sie autorisierte Netzwerke ein (constraints/sql.restrictAuthorizedNetworks).
  • Verwenden Sie nach Möglichkeit den Cloud SQL-Proxy.

  • Verwenden Sie eingeschränkte Berechtigungen für Datenbanknutzer.

  • Achten Sie darauf, dass eingehende Verbindungen auf der Cloud SQL-Datenbankinstanz nur über SSL möglich sind.

  • Achten Sie darauf, dass Cloud SQL-Datenbankinstanzen nicht öffentlich zugänglich sind.

  • Achten Sie darauf, dass Ihre MySQL-Datenbankinstanz keine Verbindungen mit Administratorberechtigungen zulässt.

Wichtige Dienste

Cloud SQL ist ein vollständig verwalteter Datenbankdienst, mit dem Sie Ihre relationalen PostgreSQL, MySQL- und SQL Server-Datenbanken ganz einfach in der Cloud einrichten, warten und verwalten können. Cloud SQL ist äußerst leistungsfähig, skalierbar und nutzerfreundlich. Cloud SQL wird auf Google Cloud gehostet und bietet eine Datenbankinfrastruktur, mit der Anwendungen überall ausgeführt werden können.

Cloud Bigtable ist eine dünn besetzte Tabelle, die auf Milliarden von Zeilen und Tausende von Spalten skaliert werden kann. Dadurch können Datenmengen im Terabyte- oder sogar Petabytebereich gespeichert werden. Ein einzelner Wert in jeder Zeile ist indexiert. Dieser Wert wird als Zeilenschlüssel bezeichnet. Cloud Bigtable ist ideal für die Speicherung von großen Datenmengen mit einem Schlüssel bei kleiner Latenz. Cloud Bigtable unterstützt einen hohen Durchsatz an Lese- und Schreibvorgängen bei kleiner Latenz und ist die ideale Datenquelle für MapReduce-Vorgänge.

Cloud Spanner ist der erste skalierbare, global verteilte Datenbankdienst für Unternehmen, der speziell für die Cloud entwickelt wurde. Er bietet strikte Konsistenz und vereint die Vorteile einer relationalen Datenbankstruktur mit einer nicht relationalen horizontalen Skalierung. Diese Kombination führt zu äußerst leistungsstarken Transaktionen und strikter Konsistenz über Zeilen, Regionen und Kontinente hinweg. Unser SLA sichert eine Verfügbarkeit von 99,999 % zu. Denn es gibt Sicherheitsstandards, die Unternehmensanforderungen gerecht werden, und keine geplanten Ausfallzeiten mehr.

Memorystore for Redis ist ein vollständig verwalteter Redis-Dienst für Google Cloud. Anwendungen, die in Google Cloud ausgeführt werden, können mithilfe des hoch skalierbaren, hochverfügbaren und sicheren Redis-Dienstes eine extrem hohe Leistung erzielen, ohne dass komplexe Redis-Bereitstellungen verwaltet werden müssen.

Firestore ist eine NoSQL-Dokumentdatenbank, die auf Autoscaling, hohe Leistung und einfache Anwendungsentwicklung ausgelegt ist. Firestore hat zwar hinsichtlich der Benutzeroberfläche viele Features mit traditionellen Datenbanken gemeinsam, beschreibt jedoch als NoSQL-Datenbank die Beziehungen zwischen Datenobjekten auf andere Weise.

Firebase Realtime Database ist eine in der Cloud gehostete Datenbank. Die Daten werden als JSON gespeichert und in Echtzeit mit jedem verbundenen Client synchronisiert. Wenn Sie plattformübergreifende Anwendungen mit unseren iOS-, Android- und JavaScript-SDKs erstellen, nutzen alle Ihre Clients dieselbe Realtime Database-Instanz und erhalten automatisch Updates mit den neuesten Daten.

Open-Source-Datenbanken: Verschiedene Partner stellen viele verschiedene Open-Source-Datenbanken bereit, z. B. MongoDB, MariaDB und Redis.

Ressourcen

Analyse

Die meisten Unternehmen möchten ihre Daten analysieren und Erkenntnisse daraus gewinnen. Google Cloud bietet Ihnen verschiedene verwaltete Tools, mit denen Sie sich auf das Schreiben Ihrer ETL-Pipeline konzentrieren können, während Google für Sie die zugrunde liegende Infrastruktur verwaltet. Je nach Ihren geschäftlichen Anforderungen und Zielen bietet Google Cloud die folgenden Dienste zum Aufnehmen, Verarbeiten, Transformieren, Analysieren und Ansehen Ihrer Daten.

Die Auswahl des richtigen Dienstes ist nicht immer einfach. Wenn Sie sich jedoch danach richten, welches Fachwissen Sie haben und was Sie sich zutrauen, fällt Ihnen die Entscheidung leichter. Mit Dataflow können Sie beispielsweise komplexe Transformationen schreiben, müssen sich dafür aber mit der Skripterstellung auskennen. Mit Dataprep können Sie Ihre Daten visualisieren und benutzerdefinierte Schemas für die Transformation Ihrer Daten erstellen.

BigQuery eignet sich ideal für ein Data Warehouse, da es sich um einen vollständig verwalteten Dienst handelt, der Ihnen automatisch bei der kostengünstigen langzeitigen Speicherung hilft. Wenn Sie eine Tabelle haben, die 90 Tage lang nicht bearbeitet wurde, sinkt der Speicherpreis für diese Tabelle automatisch um 50 %. Führen Sie immer eine Partitionierung Ihrer Daten durch und optimieren Sie Ihre BigQuery-Abfragen.

Fragen zum Design

  • Wie werden Daten aufgenommen und analysiert?
  • Haben Sie derzeit eine ETL-Pipeline eingerichtet? Wie ist sie konfiguriert?
  • Welche Art von Daten analysieren Sie normalerweise? Gibt es proprietäre Datenformate?
  • Haben Sie eine Kalkulation Ihrer vorhandenen Daten und des zu erwartenden Wachstums?
  • Nutzen Sie maschinelles Lernen? Haben Sie vor, einen verwalteten oder nicht verwalteten Dienst zu verwenden?
  • Haben Sie SLAs für Jobs oder Workflows? Wie werden sie überwacht?

Empfehlungen

  • Ermitteln Sie, ob Ihre Anwendung eine Pipeline mit genau einmaliger Bereitstellung benötigt.
  • Unterteilen Sie Ihre ETL-Funktionen mithilfe von Pub/Sub als Zwischenspeicher in kleinere Funktionen, um die Pipeline skalierbar zu machen.
  • Verwenden Sie die Jobs API, um Dataproc-Cluster zu skalieren. Dadurch können Sie Kosten reduzieren, indem Sie Jobs in vorhandenen Clustern ausführen.
  • Prüfen Sie die Abfrageleistung und partitionieren Sie Ihre BigQuery-Datasets, um die Abfragekosten zu minimieren.

Wichtige Dienste

Pub/Sub ist eine einfache, zuverlässige und skalierbare Basis für Streamanalysen und ereignisgesteuerte Computing-Systeme. Mit Pub/Sub können Sie Nachrichten zwischen unabhängigen Anwendungen senden und empfangen. In Clouds sowie in lokalen und hybriden Umgebungen gespeicherte Daten lassen sich außerdem projekt- und anwendungsübergreifend syndizieren. Die Flexibilität von Pub/Sub hilft Ihnen, Systeme und Komponenten zu entkoppeln, die in Google Cloud oder anderswo im Internet gehostet werden. Pub/Sub ist so ausgelegt, dass eine Bereitstellung mindestens einmal und mit geringer Latenz erfolgt, und ermöglicht nach Bedarf eine Skalierung auf mehrere zehn Millionen Nachrichten pro Sekunde.

Dataflow ist ein vollständig verwalteter Dienst zum Transformieren und Anreichern von Daten im Streammodus (Echtzeitdaten) und Batchmodus (Verlaufsdaten) mit gleicher Zuverlässigkeit und Aussagekraft. Mit dem serverlosen Ansatz von Dataflow müssen Sie sich nicht mehr um operative Aufgaben wie Kapazitätsplanung, Ressourcenverwaltung oder Leistungsoptimierung kümmern. Außerdem zahlen Sie nur für die tatsächliche Nutzung. Außerdem funktioniert Dataflow nicht nur mit den Google-Produkten für Datenaufnahme, Data-Warehouse-Prozesse und maschinelles Lernen, sondern auch mit Tools von Drittanbietern wie Apache Spark und Apache Beam.

Dataprep by Trifacta ist ein intelligenter Dienst für die visuelle Untersuchung, Bereinigung und Vorbereitung von strukturierten und unstrukturierten Daten für die Analyse. Dataprep ist serverlos und eignet sich für Daten jeder Größenordnung – es muss keine Infrastruktur bereitgestellt oder verwaltet werden. Bei jeder Eingabe in der Benutzeroberfläche wird Ihnen die ideale nächste Datentransformation vorgeschlagen und vorausberechnet. Damit wird das Schreiben von Code überflüssig. Dataprep erkennt automatisch Schemas, Datentypen, Möglichkeiten zur Zusammenführung und Anomalien. Das zeitaufwendige Erstellen von Datenprofilen gehört somit der Vergangenheit an und Sie können direkt zur Datenanalyse übergehen.

Datalab ist ein leistungsfähiges interaktives Tool zum Untersuchen, Analysieren, Transformieren und Visualisieren von Daten und zum Erstellen von Modellen für maschinelles Lernen in Google Cloud. Datalab ist ein interaktives Notebook, das auf Jupyter basiert und in BigQuery und AutoML integriert ist. So kann problemlos auf wichtige Datenverarbeitungsdienste zugegriffen werden. Mithilfe von TensorFlow bzw. AutoML können Sie Daten ganz einfach mit Modellen für maschinelles Lernen analysieren, die Ihnen Vorhersagen ermöglichen.

Dataproc ist ein schneller, nutzerfreundlicher, vollständig verwalteter Cloud-Dienst, über den Sie Cluster mit Apache Spark und Apache Hadoop einfacher und günstiger ausführen können. Vorgänge, für die früher Stunden oder Tage notwendig waren, dauern jetzt nur noch Sekunden oder Minuten und dank sekundengenauer Abrechnung bezahlen Sie ausschließlich die tatsächlich genutzten Ressourcen. Durch die Einbindung von Dataproc in die Speicher-, Computing- und Monitoringdienste der Google Cloud-Produkte erhalten Sie eine leistungsstarke und vollständige Plattform für die Datenverarbeitung.

Cloud Data Fusion ist ein vollständig verwalteter, cloudnativer Datenintegrationsdienst, mit dem Nutzer ETL/ELT-Datenpipelines effizient erstellen und verwalten können. Mit einer grafischen Benutzeroberfläche sowie einer umfassenden Open-Source-Bibliothek vorkonfigurierter Connectors und Transformationen verlagert Cloud Data Fusion den Fokus der Organisation von Code und Integration auf Ergebnisse und Maßnahmen.

BigQuery ist das vollständig verwaltete, kostengünstige Data Warehouse von Google, das mit Ihren Anforderungen an Speicherkapazität und Rechenleistung Schritt hält. Mit BigQuery erhalten Sie eine spaltenorientierte, ANSI-konforme SQL-Datenbank, die schnell Terabyte und sogar Petabyte an Daten analysieren kann. Mit BigQuery GIS können Sie raumbezogene Daten mit vertrauten SQL-Befehlen analysieren. BigQuery ML bietet Ihnen die Möglichkeit, mit einfachen SQL-Befehlen ML-Modelle anhand von riesigen strukturierten oder semistrukturierten Datenmengen zu erstellen und zu verwenden. BigQuery BI Engine unterstützt das interaktive Dashboarding in Echtzeit mit einer Abfragelatenz von unter einer Sekunde. Darüber hinaus bietet BigQuery Datenübertragungsdienste und flexible Datenaufnahme und Sie zahlen nur für Ihre tatsächliche Nutzung.

Cloud Composer ist ein vollständig verwalteter Workflow-Orchestrierungsdienst, mit dem Sie Pipelines über Clouds und lokale Rechenzentren erstellen, planen und überwachen können. Der Dienst basiert auf dem Open-Source-Projekt Apache Airflow und wird in der Programmiersprache Python betrieben. Cloud Composer ist anbieterunabhängig und nutzerfreundlich. Außerdem können Sie mit der End-to-End-Integration für Google Cloud-Arbeitslasten eine vollständige Pipeline mit allen Big-Data-Produkten von Google Cloud orchestrieren.

Data Catalog ist ein vollständig verwalteter, skalierbarer Metadaten-Verwaltungsdienst, mit dem Organisationen schnell alle ihre Daten in Google Cloud finden, verwalten und verstehen können. Data Catalog bietet eine einfache, nutzerfreundliche Suchoberfläche für die Datenerkennung, ein flexibles und leistungsfähiges Katalogisierungssystem zum Erfassen technischer und geschäftlicher Metadaten sowie eine starke Sicherheits- und Compliance-Grundlage mit Integrationen in Cloud Data Loss Prevention (DLP) und Cloud Identity and Access Management.

Google Data Studio ist ein vollständig verwalteter Dienst für visuelle Analysen, mit dem Ihre Mitarbeiter durch einfach zu erstellende und interaktive Dashboards Erkenntnisse aus Daten gewinnen können, um intelligentere Geschäftsentscheidungen zu treffen. Wenn Data Studio mit dem In-Memory-Analysedienst BigQuery BI Engine kombiniert wird, erreichen Datenexploration und visuelle Interaktivität selbst bei sehr großen Datasets Geschwindigkeiten von weniger als einer Sekunde.

Ressourcen