Was ist agentisches Programmieren?

Agentisches Coding ist ein Ansatz für die Softwareentwicklung, bei dem autonome KI-Agents Code mit minimaler menschlicher Interaktion planen, schreiben, testen und ändern. Im Gegensatz zu herkömmlichen KI-Codeassistenten, die darauf warten, dass Nutzer Code eingeben oder Fragen stellen, nehmen agentische Coding-Tools allgemeine Anweisungen entgegen und führen diese aus. Solche Agenten funktionieren eher wie erfahrene Auftragnehmer als wie passive Berater. Sie verstehen das Ziel, zerlegen es in Schritte und führen die notwendigen Aktionen aus, um die Arbeit zu erledigen.

Während herkömmliche KI-Tools Snippets oder einzelne Funktionen vorschlagen, können agentische Code-Lösungen komplexe Workflows verwalten. Sie können Dateisysteme durchsuchen, Abhängigkeiten verwalten und Terminalbefehle ausführen. Wenn ein Agent Code schreibt, der einen Fehler verursacht, kann er die Fehlermeldung lesen, das Problem analysieren und automatisch eine Lösung finden. Durch diese Verlagerung vom „Chatten mit KI“ zum „Zuweisen von Aufgaben an KI“ können sich Entwickler auf Architektur und Logik konzentrieren, während der Agent die Implementierungsdetails übernimmt.

Video: KI-Programmierung mit der Gemini CLI – dem Terminal-Agent-Coding-Tool von Google

38:28

KI-Programmierung mit der Gemini CLI – dem agentenbasierten Programmier-Tool von Google für das Terminal

Was ist ein Coding-Agent?

Ein Coding-Agent ist ein fortschrittliches Softwareprogramm, das auf einem Large Language Model (LLM) basiert und Softwareentwicklungsaufgaben selbstständig ausführt. Diese Agents generieren nicht nur Text, sondern nutzen einen Prozess, der oft als „Reason and Act“-Schleife bezeichnet wird. Wenn ein Ziel vorgegeben wird, zerlegt der Agent die Anfrage in kleinere, überschaubare Teilaufgaben. Anschließend werden spezifische Tools verwendet, um die Aufgaben zu erledigen, z. B. ein Zugriff auf das Dateisystem, das Ausführen von Bash-Befehlen oder die Interaktion mit Systemen zur Versionsverwaltung.

Das entscheidende Merkmal eines Coding-Agenten ist seine iterative Feedback-Schleife. Er gibt nicht einfach nur Code aus und das war's dann. Stattdessen führt er automatisierte Vorgänge aus, um seine Arbeit zu überprüfen. Ein Agent kann beispielsweise einen Testfall erstellen, den Code ausführen, einen Fehler feststellen und dann den Code so umschreiben, dass der Test bestanden wird. Diese Fähigkeit zur Selbstkorrektur ermöglicht es Coding Agents, komplexe Anweisungen zu verarbeiten, die sonst standardmäßige textbasierte KI-Modelle verwirren könnten.

Agentisches Coding im Vergleich zu „Vibe Coding“

Vibe Coding ist ein Begriff, der ein Programmiererlebnis beschreibt, das durch einen sehr flüssigen, intuitiven und ablenkungsfreien Zustand des Flows gekennzeichnet ist. Bei Nutzung dieser Methode können Sie sich ganz auf die Logik und Kreativität – die „Atmosphäre“ der Anwendung – konzentrieren, ohne sich mit Syntaxfehlern oder Boilerplate-Code aufhalten zu müssen.

Agentisches Coding hingegen ist die technologische Methodik, die diesen Zustand oft ermöglicht. Es ist ein strukturierter, autonomer Prozess, bei dem die KI die Ausführung übernimmt. Vibe Coding ist das Ziel oder das Gefühl, agentisches Coding ist der Motor. „Agentic Vibe Coding“ bedeutet, dass diese autonomen Agenten die Routinearbeit übernehmen, sodass Sie ungestört im kreativen Flow bleiben können.

Best Practices für sichere Workflows mit KI-Agenten

Die Einführung des agentischen Coding in einer Unternehmensumgebung erfordert oft strengere Sicherheitsmaßnahmen und mehr Governance. Da Agents technisch gesehen die Autonomie haben, Dateien zu bearbeiten und Befehle auszuführen, müssen Unternehmen sie genauso sorgfältig überwachen wie Mitarbeitende, Auftragnehmer oder automatisierte Skripte.

Governance und Bereichssteuerung

Umfang und Leitplanken definieren: Administratoren sollten den Zugriff des Agent einschränken und verhindern, dass er gefährliche Befehle ausführen kann, z. B. Datenbanken löschen oder Änderungen direkt in die Live-Produktionsumgebung übertragen.
Strikte Abhängigkeitsverwaltung: Sicherheitsteams müssen dafür sorgen, dass Agents nur Software aus vertrauenswürdigen und genehmigten Quellen installieren können, um das Einschleusen schädlicher Abhängigkeiten und Typosquatting-Angriffe zu verhindern.
Nachweis der Compliance anfordern: Unternehmen sollten Agents so einrichten, dass sie ihre Aktionen und Entscheidungsprozesse protokollieren. So entsteht ein Prüfpfad, der belegt, dass Codeänderungen den Compliance-Standards entsprechen.

Aufsicht und Integration

Manuelle Prüfungen in Workflows einbauen: Bevor ein von einem KI-Agenten erstellter Code in das Hauptprojekt aufgenommen wird, sollte ihn jemand aus dem Team im Rahmen des Standardverfahrens für Pull-Anfragen prüfen.
Tools für die unternehmensweite Transparenz verwenden: Unternehmen können zentrale Dashboards verwenden, um die Aktivitäten von Agenten, Nutzungskontingente und Leistungsmesswerte in verschiedenen Entwicklungsteams zu verfolgen.
Auf neue Arten von Sicherheitslücken achten: Sicherheitsteams sollten Prompt-Injection-Angriffe oder „halluzinierte“ Codepfade im Blick behalten, die Logikfehler verursachen können, die nur bei KI-generierter Software auftreten.

Testen und Qualitätssicherung

Kontrollierte Red-Team-Übungen durchführen: Sicherheitsexperten können Angriffe auf den agentischen Workflow simulieren, um zu sehen, ob der Agent dazu gebracht werden kann, unsicheren Code zu schreiben oder sensible Daten preiszugeben.
Mehrstufige Sicherheitstests durchführen: Entwickler sollten mit SAST- (Static Application Security Testing) und DAST-Tools (Dynamic Application Security Testing) automatisch von Agenten generierten Code scannen lassen.
Kontinuierliche Optimierung der Kontrollen: Teams sollten ihre Sicherheitsrichtlinien und die Anweisungen (System-Prompts) für KI-Agents regelmäßig auf Grundlage der Ergebnisse von Prüfungen und Tests aktualisieren.

Vorteile des agentenbasierten Codings

Steigert Effizienz und Skalierbarkeit

Agents können sich schnell um sich wiederholende Programmieraufgaben kümmern, sodass Teams größere Systeme entwickeln können, ohne mehr Personal zu benötigen.

Komplexe Workflows werden automatisch ausgeführt

Ein Agent kann mehrstufige Prozesse verwalten, z. B. das Aktualisieren einer Bibliothek in mehreren Dateien, ohne dass ständig menschliche Eingaben oder Anleitungen erforderlich wären.

Entwickler können sich auf wichtigere Aufgaben konzentrieren

Durch die Auslagerung von Implementierungsdetails können sich Entwickler auf komplexe Problemlösungen und strategische Architekturen konzentrieren.

Verbesserte Codequalität und Sicherheitsprüfungen

Agents können Styleguides und Best Practices für die Sicherheit konsequent anwenden, was Menschen manchmal schwer fällt.

Schnellere Bereitstellung von Funktionen und automatisierte Fehlerbehebung

Agents können die Ursache eines Fehlers in wenigen Minuten identifizieren und eine Lösung vorschlagen, wodurch der Entwicklungszyklus verkürzt wird.

Geringerer Aufwand für Entwickler und Fokus auf das übergeordnete Design

Entwickler können sich mehr auf die Architektur konzentrieren und die Struktur definieren, während der Agent die Grundlagen schafft. Das reduziert die Gefahr von Burn-outs.

Agentic Coding mit Google Cloud

Google Cloud bietet Tools, die den Workflow des agentischen Coding unterstützen und die Autonomie Ihrer Entwicklungsumgebung fördern. Im Mittelpunkt dieses Angebots stehen die Gemini CLI, Google Antigravity und Gemini Enterprise, was die Interaktion von Entwickelnden mit ihrer Codebasis verändern kann.

Agentisches Coding mit der Gemini CLI

Gemini CLI ändert die Dynamik – von der Bitte um Hilfe zur Zuweisung von Arbeit. So verwaltet es agentische Aufgaben:

Tool-Nutzung: Der Agent kann selbstständig Befehle wie „ls“, „grep“ und „cat“ ausführen. Er kann auch direkt in Dateien schreiben. Statt Ihnen vorzuschlagen, einen Test auszuführen, führt er selbst den „npm test“ aus und liest die Logs.
Speicher und Kontext: Es wird eine GEMINI.md-Datei im Stammverzeichnis Ihres Projekts unterstützt. Diese Datei dient als Langzeitgedächtnis oder System-Prompt, in dem Sie Programmierstandards, Architekturregeln oder spezifische „Vermeiden“-Anweisungen definieren, die der Agent bei jeder Aufgabe befolgt.
Selbstkorrektur: Wenn der Agent Code schreibt, der einen Build fehlschlagen lässt, wird ihm die Fehlermeldung im Terminal angezeigt. Dann wird überlegt, warum der Fehler aufgetreten ist, und automatisch eine andere Lösung versucht.
Erweiterbarkeit (MCP): Das Model Context Protocol (MCP) wird unterstützt. So können Sie den Agent mit externen Datenquellen wie PostgreSQL, GitHub oder Slack verbinden, um Kontext außerhalb Ihres lokalen Dateisystems abzurufen.

Anwendungsfälle für die Gemini CLI

Die Gemini CLI passt sich an die jeweilige Phase Ihres Entwicklungszyklus an und bietet unterschiedliche Vorteile, egal ob Sie von Grund auf neu entwickeln oder eine bestehende Codebasis verwalten.

Greenfield-Entwicklung (neue Anwendungen)

Beim Start eines neuen Projekts kann die Gemini CLI als Multiplikator für schnelles Prototyping und die Einrichtung der Architektur dienen.

Scaffolding und Initialisierung: Sie können den Agenten anweisen, eine vollständige Projektstruktur einzurichten, einschließlich Konfigurationsdateien, Verzeichnishierarchien und anfänglicher Abhängigkeiten. So kann beispielsweise ein einzelner Prompt eine Python Flask-Anwendung mit einer verbundenen Datenbank und grundlegendem Routing generieren.
Reduzierung von Boilerplate-Code: Entwickler können den Agenten mit der Generierung sich wiederholender Codestrukturen beauftragen, z. B. Datenmodelle, API-Endpunkte oder Logik zur Formularvalidierung. So können sie sich auf die eigentliche Geschäftslogik konzentrieren.
Schnelles Prototyping: Teams können Ideen schnell validieren, indem sie ein Feature in natürlicher Sprache beschreiben. Der Agent kann einen funktionsfähigen Prototyp erstellen, ihn ausführen und basierend auf Feedback iterieren. So wird die Zeit zwischen Konzept und Demo deutlich verkürzt.

Brownfield-Modernisierung (bestehende Anwendungen)

Bei älteren oder etablierten Anwendungen unterstützt die Gemini CLI die Wartung, das Refactoring und den Wissenstransfer.

Refactoring und Optimierung: Sie können den Agenten damit beauftragen, bestimmte Module zu modernisieren, z. B. ältere JavaScript-Dateien in TypeScript zu konvertieren oder veraltete API-Aufrufe zu aktualisieren. Der Agent kann den vorhandenen Code lesen, die angeforderten Änderungen anwenden und überprüfen, ob die Logik konsistent bleibt.
Testgenerierung und -abdeckung: Um die Stabilität zu verbessern, können Entwickler den Agenten bitten, eine Datei zu analysieren und umfassende Einheitentests zu schreiben. Durch den Verweis auf eine GEMINI.md-Datei mit Ihren Testkonventionen stellt der Agent sicher, dass die neuen Tests den Standards Ihres Teams entsprechen.
Dokumentation und Onboarding: Umfangreiche Codebasen können für neue Entwickler schwierig zu navigieren sein. Der Agent kann Verzeichnisse scannen, um aktuelle Dokumentationen zu erstellen, komplexe Funktionen zu erklären oder Architekturdiagramme zu erstellen. So können Teams die Software leichter verstehen und warten.

Greenfield-Entwicklung (neue Anwendungen)

Beim Start eines neuen Projekts kann die Gemini CLI als Multiplikator für schnelles Prototyping und die Einrichtung der Architektur dienen.

Scaffolding und Initialisierung: Sie können den Agenten anweisen, eine vollständige Projektstruktur einzurichten, einschließlich Konfigurationsdateien, Verzeichnishierarchien und anfänglicher Abhängigkeiten. So kann beispielsweise ein einzelner Prompt eine Python Flask-Anwendung mit einer verbundenen Datenbank und grundlegendem Routing generieren.
Reduzierung von Boilerplate-Code: Entwickler können den Agenten mit der Generierung sich wiederholender Codestrukturen beauftragen, z. B. Datenmodelle, API-Endpunkte oder Logik zur Formularvalidierung. So können sie sich auf die eigentliche Geschäftslogik konzentrieren.
Schnelles Prototyping: Teams können Ideen schnell validieren, indem sie ein Feature in natürlicher Sprache beschreiben. Der Agent kann einen funktionsfähigen Prototyp erstellen, ihn ausführen und basierend auf Feedback iterieren. So wird die Zeit zwischen Konzept und Demo deutlich verkürzt.

Brownfield-Modernisierung (bestehende Anwendungen)

Bei älteren oder etablierten Anwendungen unterstützt die Gemini CLI die Wartung, das Refactoring und den Wissenstransfer.

Refactoring und Optimierung: Sie können den Agenten damit beauftragen, bestimmte Module zu modernisieren, z. B. ältere JavaScript-Dateien in TypeScript zu konvertieren oder veraltete API-Aufrufe zu aktualisieren. Der Agent kann den vorhandenen Code lesen, die angeforderten Änderungen anwenden und überprüfen, ob die Logik konsistent bleibt.
Testgenerierung und -abdeckung: Um die Stabilität zu verbessern, können Entwickler den Agenten bitten, eine Datei zu analysieren und umfassende Einheitentests zu schreiben. Durch den Verweis auf eine GEMINI.md-Datei mit Ihren Testkonventionen stellt der Agent sicher, dass die neuen Tests den Standards Ihres Teams entsprechen.
Dokumentation und Onboarding: Umfangreiche Codebasen können für neue Entwickler schwierig zu navigieren sein. Der Agent kann Verzeichnisse scannen, um aktuelle Dokumentationen zu erstellen, komplexe Funktionen zu erklären oder Architekturdiagramme zu erstellen. So können Teams die Software leichter verstehen und warten.

Google Antigravity: Die Plattform, bei der der KI‑Agent im Mittelpunkt steht

Google Antigravity ist ein Schritt weg von einer IDE mit einem Assistenten hin zu einer dedizierten Plattform für die Entwicklung mit KI-Agenten. Dank Gemini 3 werden KI-Agents als primäre Arbeitskräfte und nicht nur als einfache Helfer betrachtet.

Manageransicht (zentrale Steuerung): Entwickelnde können über ein zentrales Dashboard mehrere Agents gleichzeitig in verschiedenen Arbeitsbereichen starten, orchestrieren und beobachten. Sie können einen Agenten mit der Recherche von Dokumentationen beauftragen, während ein anderer eine Codebasis umgestaltet.
Verifizierbare Artefakte: Anstelle von undurchsichtigen Logs generieren Antigravity-Agents strukturierte „Artefakte“ – verifizierbare Aufzeichnungen ihrer Pläne, Codeänderungen und Testergebnisse. Das sorgt für Transparenz, sodass Entwickler die Argumentation und den „Proof of Work“ des Agenten schnell prüfen können.
Browser- und Terminalautonomie: Antigravity-Agents können den Browser zur visuellen Überprüfung steuern und komplexe Terminalbefehle ausführen. So können sie Aufgaben von Anfang bis Ende erledigen, einschließlich Bereitstellung und Tests.

Gemini Enterprise: Skalierbarkeit und Sicherheit

Für Unternehmen, die Agenten in großem Umfang einsetzen, bietet Gemini Enterprise die notwendige Governance und Integration.

Zentrale Leitplanken: Administratoren können Richtlinien als Code definieren, an die sich die Agents halten müssen. So wird sichergestellt, dass kein Agenten-Workflow gegen die Compliance- oder Sicherheitsstandards des Unternehmens verstößt.
Private Wissensgrundlage: Agents können auf der privaten Codebasis und Dokumentation Ihres Unternehmens basieren. So können sie Code schreiben, der interne Bibliotheken und Architekturmuster berücksichtigt, ohne Daten preiszugeben.
Schadensersatz und Compliance: Gemini Enterprise kann eine Haftungsfreistellung bei der Verletzung geistigen Eigentum bieten und erfüllt strenge Compliance-Zertifizierungen. Damit ist es für große Unternehmen sicher, die agentenbasierte Programmierung in Produktionsumgebungen einzuführen.

Einen KI-Chatbot im Vergleich zu einem agentischen Coding-Agenten verwenden

Um die Leistungsfähigkeit des agentenbasierten Codings zu verstehen, vergleichen Sie einen Standard-KI-Chat mit einem Gemini CLI-Agenten-Workflow.

Standard-KI-Chat:

Sie: „Wie füge ich meiner Express-App einen Ratenbegrenzer hinzu?“
Gemini: „Hier ist ein Code-Snippet mit express-rate-limit…“
Sie: Sie kopieren den Code, öffnen den Editor, fügen den Code ein und starten den Server.
Person: Ich sehe einen Absturz. Kopieren Sie die Fehlermeldung.
Sie: Fügen Sie den Fehler wieder in den KI-Assistenten ein…

Gemini CLI-Agent:

Sie (im Terminal): gemini "Add a rate limiter to the server using express-rate-limit and ensure it passes tests."

Gemini CLI:

Liest die Datei „package.json“, um Abhängigkeiten zu prüfen.
Führt „npm install express-rate-limit“ aus.
Bearbeitet „server.js“, um die Middleware zu importieren und zu konfigurieren.
Führt „npm test“ aus.
(Wenn der Test fehlschlägt) Liest das Fehlerprotokoll, bearbeitet den Code noch einmal und führt den Test erneut aus.

Endgültige Ausgabe: „Aufgabe abgeschlossen. Ich habe das Paket installiert und server.js aktualisiert. Die Tests werden bestanden.“

Gemini CLI herunterladen

Die Gemini CLI ist ein Open-Source-Tool, das nicht Teil des Standard-Google Cloud SDK ist.

Installation: Sie benötigen Node.js (Version 18 oder höher).

Wird geladen...

Authentifizierung: Führen Sie den Befehl einmal aus, um sich mit Ihrem Google-Konto anzumelden. Für das kostenlose Abo ist kein API-Schlüssel erforderlich.