Was ist Cloud-Skalierbarkeit?

Cloud-Skalierbarkeit ist die Fähigkeit eines Cloud-Computing-Systems, Ressourcen wie Rechenleistung, Speicher und Netzwerk-Bandbreite zu erhöhen oder zu verringern, um sich ändernden Anforderungen gerecht zu werden. Das kann ein wichtiger Vorteil der Cloud sein, da Unternehmen so die Zu- oder Abnahmen der Arbeitslast ansprechen können, ohne ihre gesamte Infrastruktur umzugestalten. So können Sie Ressourcen ganz einfach an das Wachstum Ihres Unternehmens oder an Änderungen des Traffics zu Ihrer Anwendung anpassen und zahlen nur für das, was Sie nutzen.

Skalierbarkeit und Elastizität im Cloud Computing

Skalierbarkeit und Elastizität werden oft synonym verwendet, sind aber unterschiedliche Konzepte. Beide beziehen sich auf die Fähigkeit eines Systems, mit sich ändernden Anforderungen umzugehen, aber sie tun dies auf unterschiedliche Weise.

Skalierbarkeit

Bei der Skalierbarkeit geht es darum, dass ein System im Laufe der Zeit durch das Hinzufügen von Ressourcen eine wachsende Arbeitslast bewältigen kann. Oft ist es ein geplanter, langfristiger Ansatz, um eine gestiegene Nachfrage anzusprechen. Ein Unternehmen könnte beispielsweise planen, seine Datenbankressourcen im Vorfeld einer großen Marketingkampagne, die mehr Nutzer anziehen wird, zu erweitern. Es ist die Fähigkeit eines Systems, sich an zukünftiges Wachstum anzupassen.

Flexibilität

Elastizität ist die Fähigkeit eines Systems, Ressourcen automatisch und schnell in Echtzeit anzupassen und auf unmittelbare Änderungen der Nachfrage zu reagieren. Stellen Sie sich das wie ein Gummiband vor, das sich dehnt und wieder zusammenzieht. Eine E-Commerce-Website kann beispielsweise so konzipiert sein, dass sie automatisch mehr Server hinzufügt, um einen plötzlichen Traffic-Anstieg an einem Feiertag wie dem Black Friday zu bewältigen, und dann die Anzahl der Server wieder reduziert, wenn der Traffic nachlässt. Elastizität bedeutet dynamische, bedarfsgerechte Anpassungen an die aktuelle Nachfrage, was zur Optimierung von Kosten und Leistung beitragen kann.

Arten der Skalierbarkeit im Cloud Computing

Die Cloud-Skalierbarkeit nimmt hauptsächlich zwei Formen an: vertikale Skalierung und horizontale Skalierung. Der richtige Ansatz hängt von der Architektur der Anwendung und der Art der Arbeitslast ab.

Bei der vertikalen Skalierung, auch „Hochskalierung“ oder „Herunterskalierung“ bezeichnet, werden Ressourcen zu einem einzelnen Server oder einer einzelnen Maschine hinzugefügt oder von dort entfernt. Das ist so, als würde man einen einzelnen Computer mit einem schnelleren Prozessor oder mehr RAM ausstatten. Ziel ist es, den Rechner leistungsfähiger zu machen.

Funktionsweise der vertikalen Skalierung

Sie können vertikal skalieren, indem Sie die Kapazität einer vorhandenen virtuellen Maschine (VM) erhöhen. Wenn Ihre Anwendung beispielsweise auf einer VM mit einer bestimmten Anzahl von CPU-Kernen und einer bestimmten Menge an Arbeitsspeicher ausgeführt wird, können Sie einfach eine größere VM mit mehr Ressourcen auswählen, um zu skalieren. Ebenso können Sie durch den Wechsel zu einer kleineren VM herunterskalieren.

Bei der horizontalen Skalierung, auch „Scale-out“ oder „Scale-in“ bezeichnet, wird die Anzahl der Maschinen oder Knoten in einem System erhöht, um die Arbeitslast effektiver zu verteilen. Das ist so, als würden Sie einem Netzwerk weitere Computer hinzufügen, um die Arbeit aufzuteilen. Ziel ist es, die Kapazität durch den Einsatz mehrerer Maschinen zu erhöhen, anstatt einen Rechner leistungsfähiger zu machen.

Funktionsweise der horizontalen Skalierung

Bei der horizontalen Skalierung wird Ihre Anwendung auf mehreren VMs ausgeführt und ein Load Balancer verteilt den eingehenden Traffic auf diese Maschinen. Bei steigender Nachfrage können Sie der Gruppe automatisch oder manuell weitere VMs hinzufügen. Wenn die Nachfrage sinkt, können Sie sie entfernen.

Vertikale und horizontale Skalierung: den richtigen Ansatz wählen

Die Entscheidung zwischen vertikaler und horizontaler Skalierung hängt von der Architektur Ihrer Anwendung und Ihren Geschäftsanforderungen ab.

Funktion

Vertikale Skalierung

Horizontale Skalierung

Komplexität

Einfacher, da nur eine Maschine beteiligt ist.

Komplexer, da mehrere Knoten und ein Load Balancer verwaltet werden müssen.

Ausfallzeit

Bei einem Upgrade kann es zu einer kurzen Dienstunterbrechung kommen.

In der Regel keine Ausfallzeiten, da neue Maschinen hinzugefügt werden, ohne vorhandene zu beeinträchtigen.

Skalierbarkeitsgrenze

Durch die physische Kapazität einer einzelnen Maschine begrenzt.

Nahezu unbegrenzt, da Sie beliebig viele Maschinen hinzufügen können.

Fehlertoleranz

Hat einen Single Point of Failure: Wenn die Maschine ausfällt, ist die Anwendung nicht mehr verfügbar.

Hohe Fehlertoleranz: Fällt ein Computer aus, können die anderen weiterarbeiten.

Funktion

Vertikale Skalierung

Horizontale Skalierung

Komplexität

Einfacher, da nur eine Maschine beteiligt ist.

Komplexer, da mehrere Knoten und ein Load Balancer verwaltet werden müssen.

Ausfallzeit

Bei einem Upgrade kann es zu einer kurzen Dienstunterbrechung kommen.

In der Regel keine Ausfallzeiten, da neue Maschinen hinzugefügt werden, ohne vorhandene zu beeinträchtigen.

Skalierbarkeitsgrenze

Durch die physische Kapazität einer einzelnen Maschine begrenzt.

Nahezu unbegrenzt, da Sie beliebig viele Maschinen hinzufügen können.

Fehlertoleranz

Hat einen Single Point of Failure: Wenn die Maschine ausfällt, ist die Anwendung nicht mehr verfügbar.

Hohe Fehlertoleranz: Fällt ein Computer aus, können die anderen weiterarbeiten.

Für eine erste Leistungssteigerung kann die vertikale Skalierung die effektivste Methode sein. Wenn Ihre Anwendung wächst und eine höhere Verfügbarkeit erfordert, kann ein Wechsel zur horizontalen Skalierung sinnvoll sein. Ein hybrider Ansatz, der manchmal auch als „diagonale Skalierung“ bezeichnet wird, kombiniert beide Methoden.

Cloud-Skalierbarkeit mit Google Cloud

Zwar bieten viele Anbieter Standardfunktionen zur Skalierung, aber Google Cloud stellt eine Reihe differenzierter, flexibler Tools bereit, die auf die sich ständig ändernden Anforderungen moderner Anwendungen zugeschnitten sind. Von auf maschinellem Lernen basierenden Prognosen bis hin zu einzigartigen Hybridfunktionen können diese Angebote Ihnen helfen, Leistung und Kosten effektiver zu optimieren.

Die herkömmliche automatische Skalierung ist reaktiv – sie fügt Ressourcen erst hinzu, wenn die Nachfrage bereits gestiegen ist, was manchmal zu kurzen Leistungseinbußen führen kann. Das vorausschauende Autoscaling in der Compute Engine löst dieses Problem, indem es mit maschinellem Lernen die zukünftige Last auf Grundlage Ihrer Verlaufsdaten vorhersagt. Sie können Ihre Infrastruktur im Vorfeld des erwarteten Traffics horizontal skalieren und so dafür sorgen, dass Ihre Anwendungen bereit sind, Nutzeranfragen zu bearbeiten, sobald sie eingehen.

Die meisten Cloud-Anbieter zwingen Sie, für Ihre virtuellen Maschinen aus vordefinierten „T-Shirt-Größen“ zu wählen, was oft dazu führt, dass Sie für Ressourcen bezahlen, die Sie nicht benötigen. Google Cloud bietet benutzerdefinierte Maschinentypen, mit denen Sie die genaue Anzahl von vCPUs und den Arbeitsspeicher an Ihre Arbeitslasten anpassen können. Dank dieser detaillierten Steuerung können Sie Ihre Infrastruktur effizient vertikal skalieren und die Ressource an die Aufgabe anpassen, anstatt umgekehrt.

Für Unternehmen mit einer lokalen Infrastruktur kann es eine Herausforderung sein, plötzliche Traffic-Spitzen zu bewältigen. Mit Cloud Bursting können Sie überschüssigen Traffic nahtlos in die öffentliche Cloud auslagern, wenn Ihr privates Rechenzentrum seine Kapazitätsgrenze erreicht. Die Hybrid- und Multi-Cloud-Lösungen von Google Cloud, darunter GKE Enterprise, bieten die nötige Konsistenz und Flexibilität, um Arbeitslasten in verschiedenen Umgebungen zu verwalten. So können Sie unbegrenzt skalieren, ohne bestehende Investitionen aufgeben zu müssen.

Mit Cloud Run können Sie containerisierte Anwendungen ausführen, ohne die zugrunde liegende Infrastruktur verwalten zu müssen. Eine wichtige Eigenschaft ist die Möglichkeit, auf null zu skalieren. Das bedeutet, dass Sie bei keinem Traffic keine Ressourcen verbrauchen und nichts bezahlen. Wenn der Traffic wieder ansteigt, kann Cloud Run fast sofort von null auf Tausende von Instanzen skalieren. Das macht die Plattform ideal für Anwendungen mit stark variablen oder unvorhersehbaren Trafficmustern.

Bei der Skalierbarkeit geht es nicht nur darum, Server hinzuzufügen, sondern auch darum, Traffic effizient zu ihnen zu leiten. Google Cloud Load Balancing verwendet eine einzelne globale Anycast-IP-Adresse, um den Traffic auf Ihre Ressourcen weltweit zu verteilen. So können Sie Ihre Anwendung global skalieren, ohne komplexe DNS-Einrichtungen oder regionale Fragmentierung. Nutzer werden immer an die nächstgelegene fehlerfreie Instanz mit verfügbarer Kapazität weitergeleitet.

Die wichtigsten Vorteile der Cloud-Skalierbarkeit

Die Cloud-Skalierbarkeit bietet mehrere wichtige Vorteile, die mit einer herkömmlichen lokalen Infrastruktur nur schwer zu erreichen sind.

Kosteneffizienz

Es ist so möglich, die Überdimensionierung von Ressourcen und die hohen Kosten für die Wartung inaktiver Hardware zu vermeiden. Dank der Skalierbarkeit der Cloud zahlen Sie nur für die Ressourcen, die Sie nutzen. So werden aus Fixkosten variable Kosten.

Verbesserte Leistung und Verfügbarkeit

Durch die dynamische Anpassung der Ressourcen können Ihre Anwendungen auch bei Spitzenlasten eine hohe Leistung aufrechterhalten. So lassen sich Verlangsamungen und Dienstunterbrechungen vermeiden, die Nutzer frustrieren können.

Umgang mit unvorhersehbarer Nachfrage

Dank Skalierbarkeit können Sie unerwartete Traffic-Spitzen, wie sie beispielsweise durch einen viralen Beitrag in den sozialen Medien entstehen, bewältigen, ohne dass Sie manuell neue Hardware hinzufügen müssen.

Geschäftliche Agilität

Die Möglichkeit, schnell zu skalieren, hilft Ihnen, Innovationen zu entwickeln und schneller auf Marktveränderungen zu reagieren. Sie können neue Funktionen oder Anwendungen bereitstellen, ohne auf die Einrichtung der Infrastruktur warten zu müssen.

Meistern Sie Ihre geschäftlichen Herausforderungen mit Google Cloud

Neukunden erhalten ein Guthaben im Wert von 300 $ für Google Cloud.

Cloud-Skalierbarkeit mit Google Cloud

Google Cloud bietet eine Reihe von Diensten, mit denen Sie hoch skalierbare Anwendungen entwickeln können. Viele dieser Dienste haben integrierte Autoscaling-Funktionen, sodass Sie die zugrunde liegende Infrastruktur nicht verwalten müssen.

Gleich loslegen

Profitieren Sie von einem Guthaben über 300 $, um Google Cloud und mehr als 20 „Immer kostenlos“ Produkte kennenzulernen.

Google Cloud