Grundlegende Konzepte von KI-Agents

KI-Agenten haben sich von passiven Chatbots zu autonomen Systemen entwickelt, die in der Lage sind, zu argumentieren, Unternehmens-Tools zu nutzen und komplexe Workflows auszuführen.

Um das enorme Potenzial von KI zu nutzen und von experimentellen Anwendungsfällen und Prototypen zu robusten, unternehmenstauglichen Systemen zu gelangen, die einen messbaren ROI erzielen, ist es hilfreich, die Bausteine zu verstehen. Hier werden die wichtigsten Konzepte von KI-Agents erläutert, darunter:

  • Modelle: Die Reasoning-Engine, die der KI-Agent zum „Denken“ verwendet
  • Fundierung: Die Wissensdatenbank, die zum Mechanismus für faktische Genauigkeit und Wissensabruf wird
  • Tools: Definierte Fähigkeiten zur Ausführung von Aufgaben, die bestimmen, was ein Agent tun kann
  • Datenarchitektur: Wo der Agent seinen Speicher und seine Daten speichert
  • Orchestrierung: Wie der Agent alle Teile einer mehrstufigen Aufgabe plant und miteinander verbindet
  • Laufzeit: Hier wird der Agent ausgeführt und skaliert.

Modelle

Das Modell ist sozusagen das Gehirn Ihres Agenten. Es liest und versteht Ihre Anfragen, erkennt, was zu tun ist, und generiert intelligente Antworten.

Bei der Auswahl des richtigen Modells geht es darum, die Fähigkeiten, die Geschwindigkeit und die Kosten für Ihren Anwendungsfall in Einklang zu bringen. Es geht nicht darum, die Leistung zu maximieren, sondern die Effizienz zu optimieren. Der häufigste Fehler ist, zu viel in Funktionen zu investieren, die für einen Anwendungsfall nicht erforderlich sind. Das führt zu ineffizienten Ausgaben und einer langsameren Leistung.

Robuste kognitive Architekturen verwenden mehrere spezialisierte Agents, die dynamisch das schlankste Modell für ihre spezifische Teilaufgabe auswählen. Es ist, als hätten Sie ein Team von Fachleuten zur Hand, wobei die Aufgaben intelligent an die verschiedenen Spezialisten weitergeleitet werden. So wird beispielsweise ein leistungsstarkes Modell für die komplexe Planung und Schlussfolgerung reserviert, während einfachere Aufgaben mit hohem Volumen, wie die Klassifizierung der Nutzerabsicht, an ein schnelleres und kostengünstigeres Modell weitergeleitet werden. Dieses dynamische Modell-Routing ist entscheidend für die Optimierung von Leistung und Kosten.

Durch die große Auswahl an Modellen und die konfigurierbaren Reasoning-Modi erhalten Entwickler dynamische Möglichkeiten zur Optimierung. So können sie die Kosten und die Leistung eines gesamten Multi-Agent-Systems an die spezifischen geschäftlichen und technischen Anforderungen anpassen.

Nachdem Sie ein Modell ausgewählt haben, das Ihren Anforderungen an Kosten, Latenz und Qualität entspricht, haben Sie möglicherweise die Option einer Feinabstimmung. Dadurch werden Wissen und Stil auf Ihre spezifischen Geschäftsanforderungen abgestimmt. Dies geschieht mithilfe eines kuratierten Datasets mit Ihren eigenen hochwertigen Beispielen. Ob ein Modell das Finetuning zulässt und unterstützt, erfahren Sie in der Dokumentation und der Lizenzvereinbarung.

Detaillierte Anleitung: Unternehmensagenten entwickeln

Möchten Sie die Modellauswahl in die Praxis umsetzen? Hier erfahren Sie, wie Sie Sicherheit, Zuverlässigkeit und Effizienz in einer robusten kognitiven Architektur in Einklang bringen.

Technischer Leitfaden zum Erstellen von Multi-Agent-Systemen für Unternehmen abrufen.


Profitipp

Nutzen Sie eine zentrale Plattform, um Foundation Models zu finden, anzupassen und bereitzustellen. Suchen Sie eine Plattform, die eine sorgfältig zusammengestellte Auswahl der weltweit besten Modelle bietet, über die Sie mit einem einzigen Klick Bereitstellungen auslösen können und die von Anfang an Sicherheit auf Unternehmensniveau bietet.

Fundierung

Glaubwürdigkeit und Nützlichkeit eines KI-Agents hängen davon ab, ob er korrekte, vertrauenswürdige Antworten auf der Grundlage überprüfbarer Fakten liefern kann. Hier kommt die Fundierung ins Spiel. Sie verwandeln Agenten in echte Workflow-Automatisierer, die auf tiefgehende und korrekte Art auf Ihren Geschäftsdaten aufbauen.

Bei der Fundierung müssen drei Ebenen berücksichtigt werden.

1. RAG: Ein grundlegender erster Schritt

Die Glaubwürdigkeit eines KI-Agents hängt davon ab, ob er Antworten auf der Grundlage überprüfbarer Fakten liefern kann. Retrieval-Augmented Generation (RAG) verbindet einen Agent mit einer Quelle überprüfbarer Echtzeitdaten. So kann der Agent auf der Grundlage von Fakten und nicht von Halluzinationen handeln.

Dieser einfache Prozess des Abrufens und anschließenden Generierens kann auf Text, Bilder und andere Datentypen angewendet werden. Damit lassen sich riesige Datasets blitzschnell durchsuchen, was zu responsiven und zeitnahen Entscheidungen führt.

RAG hilft zwar bei der Beantwortung von Fragen, stößt aber bei komplexen Abfragen an seine Grenzen, die ein tieferes Verständnis der Beziehungen zwischen Datenpunkten erfordern.

2. GraphRAG: Intelligenter fundieren

GraphRAG verbessert die Verankerung, indem es die expliziten Beziehungen zwischen Datenpunkten in einem Knowledge Graph versteht und Kontextdaten abruft, die die Verbindungen zu anderen Datenquellen besser widerspiegeln. Anstatt also nur ähnliche Sätze abzugleichen, versteht Ihr Agent, wie Konzepte zusammenhängen.

Wichtig ist, dass Sie mit Wissensgrafen die direkte Kontrolle über Ihre Geschäftslogik haben. Während sich Standard-RAG auf von Modellen generierte Muster verlässt, können Sie mit einem Knowledge Graph die spezifischen Beziehungen zwischen Entitäten definieren und verwalten. So wird sichergestellt, dass der Agent die einzigartige Taxonomie und die Regeln Ihres Unternehmens berücksichtigt. Für maximale Zuverlässigkeit setzen führende Unternehmen auf einen hybriden Ansatz, bei dem der breitgefächerte Ansatz von Standard-RAG mit der Präzision und Kontrolle von GraphRAG kombiniert wird.

Anwendungsfall

Strukturierte Ansicht von Daten aus unterschiedlichen Quellen

Finanzdienstleister nutzen Wissensgraphen, um Analysten einen einheitlichen Überblick über Analystenberichte, Telefonkonferenzen zu Quartalsergebnissen, Risikobewertungen und mehr zu geben. Dieses umfangreiche, vernetzte Datennetzwerk hilft Analysten, bisher verborgene Erkenntnisse zu gewinnen, z. B. komplexe Abhängigkeiten in der Lieferkette, Überschneidungen bei Vorstandsmitgliedschaften von Wettbewerbern und die Anfälligkeit für komplexe geopolitische Risiken.

3. Agentic RAG: Dynamische Schlussfolgerung und Abruf

Der leistungsstärkste Ansatz für das Grounding ist Agentic RAG, bei dem der Agent nicht mehr nur passiv Informationen empfängt, sondern aktiv und mitdenkend am Abrufprozess beteiligt ist. Mit Agentic RAG kann ein Agent eine komplexe Abfrage analysieren, einen mehrstufigen Plan formulieren und mehrere Toolaufrufe nacheinander ausführen, um die bestmöglichen Informationen zu finden. Das ist kein Ersatz für die herkömmliche Suche, sondern eine Ergänzung Ihrer bestehenden RAG- und Knowledge Graph-Infrastruktur, um komplexe Anfragen zu beantworten.

Durch die Fähigkeit, verschiedene Datentypen zu erkennen und zu verarbeiten, wird der Agent von einem Datenverarbeitungstool zu einem Problemlösungstool, das die Welt umfassender versteht und mit ihr interagiert. Wenn der Agent ein aktiver, denkender Teilnehmer ist, können Entwickler Systeme erstellen, die komplexe, mehrstufige Abfragen und Aufgaben mit langem Horizont ausführen können, die die Agent-Funktionen der nächsten Generation definieren.

Profitipp

Abruf- und Neusortierungsansatz verwenden

Gehen Sie den Kompromiss zwischen Recall (alle relevanten Dokumente finden) und Precision (sicherstellen, dass die abgerufenen Dokumente relevant sind) mit dem Ansatz „Abrufen und neu bewerten“ an, der den Recall-Bereich erweitert, um eine größere als die benötigte Menge an Dokumenten abzurufen. Dieses größere Set wird an das LLM oder einen spezialisierten Re-Ranking-Dienst übergeben, der die relevantesten Dokumente identifiziert und alle irrelevanten oder semantisch gegensätzlichen Dokumente verwirft.

Hinweis

Feinabstimmung ist keine Fundierung. Durch die Feinabstimmung wird der Stil eines Modells angepasst und sein Wissen über eine bestimmte Aufgabe verfeinert. Durch die Fundierung wird das Modell mit überprüfbaren Echtzeit-Datenquellen verbunden, um sicherzustellen, dass die Antworten faktisch korrekt sind.

Tools

Tools sind definierte Funktionen, die es einem Agenten ermöglichen, über die nativen Funktionen seines Kernmodells hinauszugehen. Von einfachen internen Berechnungen bis hin zur Interaktion mit externen Systemen über API-Aufrufe – Tools schließen die Lücke zwischen der Schlussfolgerung des Agenten und seiner Handlungsfähigkeit. Da die Fundierung für Agenten die wichtigste Methode für den Abruf neuer Informationen ist, ist sie technisch gesehen das grundlegendste Tool im Toolkit eines Agenten.

Beispiele:

  • Interne Funktionen und Dienste: Proprietäre Logik oder spezieller Code, der von Ihrem eigenen Team geschrieben wurde, um unternehmensspezifische Probleme zu lösen.
  • Externe APIs: Sichere Verbindungen zu Drittanbieterdiensten, die es einem Agenten ermöglichen, Aufgaben in der realen Welt auszuführen.
  • Datenabruf und -verankerung: Die Möglichkeit, dynamisch Datenbanken abzufragen (einschließlich natürlicher Sprache zu SQL), Vektorspeicher zu durchsuchen oder auf unternehmenseigene Wissensdatenbanken zuzugreifen. Ob einfache Suche oder komplexe Datenbankabfrage – diese Tools sorgen dafür, dass die Aktionen des KI-Agents auf überprüfbaren Daten basieren.
  • Zusammenarbeit von Agenten: In komplexeren Systemen kann ein Agent mit einem anderen spezialisierten Agenten zusammenarbeiten, um ein Problem zu lösen. Ein Agent kann zwar als „Tool“ für eine bestimmte Aufgabe verwendet werden, aber die leistungsstärksten Unternehmenssysteme behandeln ihn als Mitarbeiter, der Aktionen in verschiedenen Bereichen sicher koordiniert.

Datenarchitektur

Agents verwenden unterschiedliche Arten von Speicher für unterschiedliche Aufgaben. Eine robuste Unternehmensdatenarchitektur muss drei unterschiedliche Anforderungen erfüllen: nichtflüchtigen Speicher für den langfristigen Wissensabruf, Zugriff mit niedriger Latenz für den kurzfristigen Konversationskontext und ein dauerhaftes Verzeichnis für die Transaktionsprüfung.

1. Langfristige Wissensdatenbank (Verankerung und Gedächtnis)

Das Langzeitgedächtnis ist die Grundlage für die Intelligenz, die Verankerung und die Personalisierung eines Agenten und unterscheidet sich vom schnellen, kurzfristigen Kontext einer Live-Unterhaltung. Die Architektur besteht aus drei Kernkomponenten:

  • Einer strukturierten Wissensdatenbank für faktenbasierte Retrieval-Augmented Generation (RAG)
  • Einem dauerhaften Speicher für destillierte Nutzererinnerungen. Anstatt jede historische Interaktion zu speichern, generiert und speichert der Agent wichtige Fakten über die Nutzerin oder den Nutzer, das Team oder die Aufgabe, um eine kontinuierliche, personalisierte Nutzung zu ermöglichen.
  • Einem operativen Data Lake für Rohdaten wie Gesprächstranskripte und Workflow-Zustände, der komplexere kognitive Prozesse und zukünftige Analysen ermöglicht

Anwendungsfall

Zugriff auf alle relevanten Informationen

Ein Rechts-Agent ruft sofort Fallrecht, interne Richtliniendokumente und Schulungshandbücher ab, um einen rechtskonformen ersten Entwurf eines Vertrags zu erstellen.

2. Arbeitsspeicher (Konversationskontext und kurzfristiger Zustand)

Diese Ebene verwaltet die temporären Informationen (das Kontextfenster des LLM), die für eine laufende Aufgabe oder Unterhaltung erforderlich sind. Um eine responsive Nutzung zu gewährleisten, muss der Zugriff auf die iterative Abfolge von Aktionen und Beobachtungen mit extrem niedriger Latenz erfolgen.

Anwendungsfall

Hilfreiche Unterhaltungen führen

Ein Kundensupport-Agent verwaltet den Status eines mehrstufigen Ablaufs zur Fehlerbehebung und merkt sich die zuvor angegebenen Seriennummern oder Diagnoseschritte, um Wiederholungen zu vermeiden.

3. Transaktionsspeicher (Zustandsverwaltung und Aktionsprüfung)

Diese Ebene ist für das Aufzeichnen von Aktionen und Zustandsänderungen mit strikter Konsistenz und Integrität verantwortlich. Es dient als dauerhaftes System für Aufzeichnungen, was aus Sicherheitsgründen und für die Bereitstellung eines verlässlichen Audit-Trails für jede durch einen Agenten ausgelöste Aktion unerlässlich ist.

Anwendungsfall

Ein dauerhaftes Verzeichnis führen

Ein Supply-Chain-Agent zeichnet die erfolgreiche Ausführung eines komplexen, mehrteiligen Auftrags auf und sorgt dafür, dass die Transaktion dauerhaft in allen Finanzsystemen nachverfolgt und verifiziert werden kann.

Orchestrierung

Die Orchestrierung ist der operative Kern, der einen Agenten durch eine mehrstufige Aufgabe führt. Für jeden Prozess, der mehr als eine Aktion erfordert, wird festgelegt, welche Tools in welcher Reihenfolge benötigt werden und wie ihre Ausgaben kombiniert werden sollten, um ein Endergebnis zu erzielen.

Als wichtige Funktion der Agenten ist die Orchestrierung bei der Schaffung komplexe Geschäftsprozesse automatisierenden Systemen von größter Wichtigkeit. Sie erlaubt es, zuvor technisch nicht lösbare Probleme anzugehen und letztlich eine neue Klasse von Anwendungen und Nutzererlebnissen schaffen.

Ein häufig verwendetes und effektives Orchestrierungsmuster ist ReAct (Reason + Action). Dieses Framework kombiniert die Schlussfolgerungs- und Handlungsfähigkeiten von Large Language Models und schafft eine dynamische, mehrstufige Schleife, in der das Modell sowohl Schlussfolgerungsspuren (Gedanken) als auch aufgabenspezifische Aktionen ineinandergreifend generiert.

Mit ReAct kann das Modell mithilfe der Schlussfolgerungen Aktionspläne verfolgen und aktualisieren, während Aktionen Informationen aus externen Tools erfassen, um den Schlussfolgerungsprozess zu unterstützen. So funktionierts:

  1. Grund: Der Agent bewertet das Ziel und den aktuellen Zustand und formuliert eine Hypothese über den nächsten besten Schritt und ob ein Tool erforderlich ist.
  2. Aktion: Der Agent wählt das passende Tool aus und ruft es auf.
  3. Beobachtung: Der Agent erhält die Ausgabe des Tools. Diese neuen Informationen werden in den Kontext des Agents eingebunden und fließen in den nächsten Schritt des Zyklus ein.

Anwendungsfälle

Abteilungsübergreifende Automatisierung von HR-Prozessen

Um einen neuen Mitarbeiter einzuarbeiten, initiiert der Agent sequenziell Aktionen in mehreren Systemen. Zuerst wird ein Mitarbeiterdatensatz im System erstellt, dann wird ein API-Aufruf an den IT-Agenten ausgelöst, um Hardware und Netzwerkanmeldedaten bereitzustellen, und schließlich wird der Mitarbeiter in den erforderlichen regionalen Compliance-Schulungsmodulen angemeldet.

Proaktive Korrektur der Lieferkette

Um Versandunterbrechungen automatisch zu erkennen und zu beheben, wird ein Agent so orchestriert, dass er die wichtigsten Schritte ausführt. Zuerst löst eine Monitoring-Warnung ein Tool aus, das alternative Lieferanten abfragt. Anschließend wird mit einem Simulationstool das Kosten-Nutzen-Verhältnis eines Lieferantenwechsels im Vergleich zu einer verzögerten Lieferung berechnet. Wenn die Aktion von einem Human-in-the-Loop genehmigt wurde, wird sie ausgeführt und ein neuer Kaufauftrag an den Logistikdienstleister gesendet.

Laufzeit

Um einen funktionsfähigen Agent-Prototyp in einer Produktionsumgebung in großem Maßstab bereitzustellen, benötigen Sie eine robuste Laufzeitinfrastruktur, die in ein zusammenhängendes System von Diensten für Grounding, Tools, Speicher, Sitzungen und den Rest eingebunden ist. So können Ihre Agents in einer sicheren, leistungsstarken Umgebung arbeiten, die die komplexen Anforderungen des globalen Unternehmenswachstums bewältigen kann.

Eine für die Produktion geeignete Laufzeitumgebung erfordert:

Skalierbarkeit: Die Infrastruktur muss automatisch skaliert werden, um variable Lasten zu bewältigen, von null bis zu Millionen von Anfragen. Dazu gehören sowohl das anfragebasierte Load Balancing als auch das ressourcenbasierte Autoscaling, um die Rechenanforderungen effizient zu verwalten.

Sicherheit und Kontrolle: Die Plattform muss eine sichere Ausführungsumgebung bieten, in der die Identität von Nutzern und Agents, Organisationsrichtlinien, Tool- und Agent-Registrierungen, Netzwerkzugriffssteuerungen und sichere Kommunikationskanäle (z. B. TLS) verwaltet werden, um den Agent und die von ihm aufgerufenen Daten zu schützen.

Zuverlässigkeit und Beobachtbarkeit: Das System muss Mechanismen für die Fehlerbehandlung und das kontinuierliche Monitoring umfassen. Für komplexes Debugging muss die Laufzeit hochgenaue Ausführungstraces erfassen – eine Schritt-für-Schritt-Aufzeichnung der Schlussfolgerungen des Agents und der Tool-Aufrufe. So wird der gesamte Entscheidungsprozess sichtbar, sodass Ihre Teams bei einem unerwarteten Fehler die Frage „Warum?“ beantworten können. Für eine allgemeine Übersicht muss das System Messwerte zur Aufgabenerfüllung und Nutzerfeedback enthalten. Automatisierung mit Simulationen und Bewertungen schafft Vertrauen vor und nach der Bereitstellung in der Produktion.

Hier erfahren Sie, wie Sie KI-Agents erstellen, skalieren und verwalten.

Unser Leitfaden für Unternehmen zu Multi-Agent-Systemen zeigt Ihnen, wie Sie effiziente, skalierbare und sichere KI-basierte Lösungen entwickeln können, ohne die Robustheit des Unternehmens zu beeinträchtigen.

Google Cloud