In dieser Anleitung erfahren Sie, wie Sie eine generative KI-Anwendung in Cloud Run bereitstellen und mit Identity-Aware Proxy (IAP) schützen. IAP bietet eine zentrale Autorisierungsebene für HTTPS-Anwendungen, die in Cloud Run bereitgestellt werden. Mit IAP können Sie Richtlinien für die Zugriffssteuerung auf Anwendungs- oder Unternehmensebene anwenden, anstatt Firewalls auf Netzwerkebene zu nutzen.
Sie können zwar auch eine manuelle Authentifizierung oder die Authentifizierung durch Drittanbieter verwenden, um eine in Cloud Run bereitgestellte App zu schützen. Wir empfehlen jedoch, IAP für große Mengen oder multiregionalen Traffic zu verwenden, um Unterbrechungen bei der Anwendungsbereitstellung zu vermeiden.
In dieser Anleitung stellen Sie eine Anwendung bereit, die die Gemini API aufruft. Die Anwendung basiert auf dem Streamlit-Framework.
Vorbereitung
In dieser Anleitung wird davon ausgegangen, dass Sie die folgenden Tools und Frameworks verwenden können:
Streamlit: Streamlit ist ein Open-Source-App-Framework, mit dem Sie Datenanwendungen erstellen und bereitstellen können. Es wandelt Datenscripts mit Python in Webanwendungen um.
Git: In dieser Anleitung verwenden Sie ein Git-Repository, um den Quellcode Ihrer Anwendung zu verwalten. Weitere Informationen zur Verwendung von Git finden Sie in der Git-Dokumentation.
Google Cloud-Dienste
Sie sollten grundlegende Kenntnisse der folgenden Google Cloud-Dienste haben:
Generative KI in Vertex AI: Bietet Zugriff auf die LLMs von Google, damit Sie sie testen, optimieren und für die Verwendung in Ihren Anwendungen bereitstellen können. Weitere Infos zu generativer KI in Vertex AI.
Cloud Run: Eine verwaltete Computing-Plattform, mit der Sie Container-Images bereitstellen und ausführen können. Sie erstellen einen Cloud Run-Dienst, um Ihre Anwendung bereitzustellen. Weitere Informationen zu Cloud Run
Cloud Build: Führt Ihre Builds in Google Cloud aus. In dieser Anleitung richten Sie einen automatischen Cloud Build-Trigger ein, um Ihre Anwendung jedes Mal in Cloud Run zu erstellen und bereitzustellen, wenn Sie Ihre Commits in das Git-Repository pushen. Weitere Informationen zu Cloud Build
Cloud Load Balancing: Hilft, den Traffic auf mehrere Instanzen Ihrer App zu verteilen, um Skalierbarkeit zu erreichen. Sie erstellen einen Application Load Balancer, um den Traffic an die in Cloud Run gehosteten Backend-Instanzen der Anwendung zu verteilen. Cloud Load Balancing ist auch eine Voraussetzung für IAP. Weitere Informationen zu Cloud Load Balancing
Identity-Aware Proxy (IAP): Mit IAP können Sie eine zentrale Autorisierungsebene erstellen, um die Anwendung zu schützen. IAP führt Authentifizierungs- und Autorisierungsüberprüfungen durch, die auch verknüpfte Google Cloud-Dienste einbeziehen. IAP unterstützt außerdem Cloud Load Balancing und lässt sich nahtlos in diese Funktion einbinden. Daher ist es die effizienteste Option für die Sicherheitsverwaltung in diesem Tutorial.
Weitere Informationen zu IAP finden Sie im Überblick über Identity-Aware Proxy.
Informationen zur Funktionsweise von IAP mit Cloud Run finden Sie im Abschnitt zu Cloud Run des Artikels „So funktioniert IAP“.
Gültiger Domainname
Außerdem benötigen Sie einen gültigen Domainnamen, um ein Zertifikat bereitzustellen, das für die Konfiguration des Load Balancers erforderlich ist.
Anleitungsseiten
Diese Anleitung umfasst die folgenden Seiten:
Auf jeder Seite wird davon ausgegangen, dass Sie die Anweisungen von den vorherigen Seiten der Anleitung bereits ausgeführt haben.