Direkt zum Inhalt
Container & Kubernetes

Robotik-Start-up wechselt in die Cloud und senkt mit GKE Autopilot seine Kubernetes-Betriebskosten

4. Oktober 2022
https://storage.googleapis.com/gweb-cloudblog-publish/images/data_studio.max-2600x2600.jpg
Chris Willis

Customer Engineer

Ihre Frage – unsere Antwort

Ganz gleich, wo Sie sich auf Ihrer Google Cloud- oder Google Workspace-Reise befinden, wir freuen uns, von Ihnen zu hören. Reichen Sie Ihre Fragen hier ein, um die Chance zu haben, die Antwort im Blog zu bekommen.

Jetzt fragen

Still und heimlich sind mehr als 20.000 Roboter von Brain Corp damit beschäftigt, in Fabriken, Supermärkten, Schulen und Lagerhäusern Böden zu reinigen, Bestände zu erfassen, Regale aufzufüllen und andere zeitaufwändige Arbeiten auszuführen. Die KI-Softwareplattform BrainOS®, die diese autonomen mobilen Roboter antreibt, läuft nicht etwa in den Robotern selbst – sie läuft in der Cloud. Genauer gesagt, in der Google Cloud.

Doch das war nicht immer so. Erst jüngst hat sich Brain Corp mit Google Cloud zusammengetan, um seine Robotikplattform von Amazon EKS auf Google Kubernetes Engine (GKE) Autopilot umzustellen. Der Betrieb von Tausenden von Robotern in der Produktion bringt zahllose Herausforderungen mit sich. Brain Corp war deshalb sehr darauf bedacht, den mit dem Aufbau einer Kubernetes-Plattform (k8s) üblicherweise verbundenen Betriebs-, Sicherheits- und Wartungsaufwand zu verringern.

Mit dem Umstieg auf GKE Autopilot gab das Unternehmen alle Aufgaben rund um die Hochverfügbarkeit der Cluster und das Patchen mit den jeweils neuesten Sicherheitsupdates an die Google Cloud Site Reliability Engineers (SREs) ab – und sparte sich so eine Menge Arbeit. Das Betriebsteam von Brain Corp ist jetzt nicht mehr ständig damit beschäftigt, seine k8s-Cluster am Laufen zu halten, sondern kann sich ganz auf die Umstellung weiterer Roboter auf die neue Plattform konzentrieren.

Der Wechsel zu Google Cloud

Als Brain Corp beschloss, aus EKS auszusteigen, machte sich das Unternehmen auf die Suche nach einer Cloud, mit der besten Technologie, den besten Tools und der besten Plattform für eine möglichst einfache Integration von Daten und Robotik. Das Cloud-Entwicklungsteam richtete dazu eine Testarchitektur für die Unterstützung seiner Roboter bei Google Cloud und einem anderen Cloud-Anbieter ein. Google Cloud erwies sich als die richtige Wahl: Die Testarchitektur war bereits nach einer Woche einsatzbereit, während der Aufbau bei dem anderen Cloud-Anbieter einen ganzen Monat dauerte.

Im Laufe des Tests erkannte Brain Corp über die Benutzerfreundlichkeit hinaus noch eine Reihe weiterer Vorteile. Dank der für Google typischen einfachen Integration zwischen den Datenprodukten war der Schritt vom Test zur Produktion leicht getan. 

Der Wechsel zu GKE Autopilot

Laut Alex Gartner, Cloud Infrastructure Lead bei Brain Corp, sind er und sein Team dafür zuständig, dass „die Entwicklungsteams schnell Lösungen entwickeln und bereitstellen können, ohne lange grübeln zu müssen“. Bei EKS hatte Brain Corp spezielle Ingenieurinnen und Ingenieure beschäftigt, allein um die Kubernetes-Infrastruktur zu verwalten. Gartner war erfreut festzustellen, dass sein Team dieser Aufgaben beim GKE entbunden war. Da GKE Autopilot-Cluster sehr hohe Sicherheitsanforderungen durch Vorkunfiguration erfüllen und von Google SREs unterstützt werden, konnte Brain Corp seine Betriebskosten senken und seinen Kunden ein besseres und sichereres Erlebnis bieten.

Ein weiterer Grund für den Wechsel zu GKE Autopilot waren die zusätzlichen Sicherheitsrichtlinien in der Entwicklungsumgebung. Früher konnte eine kleine Fehlkonfiguration in der Brain Corp-Entwicklungsumgebung zu Cluster-Ausfällen führen. „Dank Autopilot brauchen wir nicht mehr Zeile für Zeile in der Dokumentation nachzulesen, wie ein hochverfügbares und ausfallsicheres k8s-Cluster bereitgestellt werden muss“, sagt Gartner. Ohne Autopilot hätte das Team einen ganzen Monat lang GKE-Fehlerszenarien untersuchen müssen, um die Stabilität zu erreichen, die Autopilot standardmäßig bietet. „Google SREs kennen ihren Service besser als wir und können Fehlerszenarien berücksichtigen, die wir nie bedacht hätten.“ Zum Beispiel haben die Ingenieurteams von Brain Corp keine Möglichkeit, Szenarien mit Quoten- oder Kapazitätsüberschreitungen zu simulieren.

Wie hat GKE Autopilot Brain Corp geholfen?

Seit der Einführung von GKE Autopilot wird das Cloud-Infrastrukturteam von Brain Corp seltener mitten in der Nacht zu Hilfe gerufen, weil ein Cluster oder Dienst plötzlich ausgefallen ist. Die Cluster werden von Google Cloud skaliert und gewartet. Mit strengeren Sicherheitsrichtlinien für Cluster, die sich nicht deaktivieren lassen, bietet Autopilot „von Haus aus einen besseren Schutzschild“, erklärt Gartner. Außerdem erleichtert er die Erfassung und Visualisierung von Leistungsmetriken enorm, indem er standardmäßig jede Menge k8s- und Leistungskennzahlen exportiert. „Jetzt brauchen wir nicht mehr lange darüber nachzudenken, wie wir diese Informationen erfassen können.“

https://storage.googleapis.com/gweb-cloudblog-publish/images/GKE_Autopilot_1.max-1000x1000.png

Autopilot erleichtert auch die Arbeit des Sofwareentwicklungsteams von Brain Corp, das eine Menge Rechenaufgaben im Hintergrund ausführt und bisher nicht in der Lage war, die genauen Kosten und Rechenanforderungen auf Pod-Ebene zu bestimmen. Die Pod-genaue Autopilot-Abrechnung sorgt für mehr Transparenz, sodass die Kosten der jeweiligen Aufgaben jetzt genau festgehalten werden können. Außerdem lassen sich Rechenanforderungen seither gezielt an die Pods selbst richten. Die Abrechnung auf Anwendungsebene macht die interne Kostenzuordnung einfacher, als wenn fünf Teams ein überdimensioniertes Cluster gemeinsam nutzen und sich die Rechnung irgendwie teilen müssen. „Wir möchten keine Zeit in die Optimierung der k8s-Abrechnung stecken“, sagt Gartner. Die Kosteneinsparungen sind ein großer Vorteil der Umstellung auf Autopilot. „Allein für den Betrieb eines k8s-Knotens fallen sonst 5–10 % zusätzliche Verwaltungskosten an, die uns jetzt nicht mehr in Rechnung gestellt werden. Wir zahlen nur noch für das, was unsere App tatsächlich nutzt.“

Wie kann Autopilot verbessert werden?

GKE Autopilot wurde letztes Jahr eingeführt und bietet noch nicht den vollen Leistungsumfang von GKE. So lassen sich bestimmte wissenschaftliche Arbeitslasten beispielsweise nur – oder zumindest besser – mit besonderen CPU-Befehlssätzen bewältigen. „Über GPU-Unterstützung würden wir uns freuen“, meint Gartner. Doch auch so überwiegen die Vorteile von GKE Autopilot – und in der Zwischenzeit kann das Team für einzelne Arbeitslasten bei Bedarf GKE-Standardcluster hochfahren.

Dank GKE Autopilot haben die Entwicklungs- und Ingenieurteams von Brain Corp nun Zeit, sich auszudenken, was Roboter sonst noch für uns tun können – wir werden darüber berichten.

Sind Sie neugierig auf GKE und GKE Autopilot? Sehen Sie sich die KubeCon-Vorträge von Google Cloud aus unserem On-Demand-Angebot an.

Gepostet in