Grundlegende Konzepte von KI-Agents
KI-Agenten haben sich von passiven Chatbots zu autonomen Systemen entwickelt, die in der Lage sind, zu argumentieren, Unternehmens-Tools zu nutzen und komplexe Workflows auszuführen.
Um das enorme Potenzial von KI zu nutzen und von experimentellen Anwendungsfällen und Prototypen zu robusten, unternehmenstauglichen Systemen zu gelangen, die einen messbaren ROI erzielen, ist es hilfreich, die Bausteine zu verstehen. Hier werden die wichtigsten Konzepte von KI-Agents erläutert, darunter:
Modelle
Das Modell ist sozusagen das Gehirn Ihres Agenten. Es liest und versteht Ihre Anfragen, erkennt, was zu tun ist, und generiert intelligente Antworten.
Bei der Auswahl des richtigen Modells geht es darum, die Fähigkeiten, die Geschwindigkeit und die Kosten für Ihren Anwendungsfall in Einklang zu bringen. Es geht nicht darum, die Leistung zu maximieren, sondern die Effizienz zu optimieren. Der häufigste Fehler ist, zu viel in Funktionen zu investieren, die für einen Anwendungsfall nicht erforderlich sind. Das führt zu ineffizienten Ausgaben und einer langsameren Leistung.
Robuste kognitive Architekturen verwenden mehrere spezialisierte Agents, die dynamisch das schlankste Modell für ihre spezifische Teilaufgabe auswählen. Es ist, als hätten Sie ein Team von Fachleuten zur Hand, wobei die Aufgaben intelligent an die verschiedenen Spezialisten weitergeleitet werden. So wird beispielsweise ein leistungsstarkes Modell für die komplexe Planung und Schlussfolgerung reserviert, während einfachere Aufgaben mit hohem Volumen, wie die Klassifizierung der Nutzerabsicht, an ein schnelleres und kostengünstigeres Modell weitergeleitet werden. Dieses dynamische Modell-Routing ist entscheidend für die Optimierung von Leistung und Kosten.
Durch die große Auswahl an Modellen und die konfigurierbaren Reasoning-Modi erhalten Entwickler dynamische Möglichkeiten zur Optimierung. So können sie die Kosten und die Leistung eines gesamten Multi-Agent-Systems an die spezifischen geschäftlichen und technischen Anforderungen anpassen.
Nachdem Sie ein Modell ausgewählt haben, das Ihren Anforderungen an Kosten, Latenz und Qualität entspricht, haben Sie möglicherweise die Option einer Feinabstimmung. Dadurch werden Wissen und Stil auf Ihre spezifischen Geschäftsanforderungen abgestimmt. Dies geschieht mithilfe eines kuratierten Datasets mit Ihren eigenen hochwertigen Beispielen. Ob ein Modell das Finetuning zulässt und unterstützt, erfahren Sie in der Dokumentation und der Lizenzvereinbarung.
Detaillierte Anleitung: Unternehmensagenten entwickeln
Möchten Sie die Modellauswahl in die Praxis umsetzen? Hier erfahren Sie, wie Sie Sicherheit, Zuverlässigkeit und Effizienz in einer robusten kognitiven Architektur in Einklang bringen.
Technischer Leitfaden zum Erstellen von Multi-Agent-Systemen für Unternehmen abrufen.
Profitipp
Nutzen Sie eine zentrale Plattform, um Foundation Models zu finden, anzupassen und bereitzustellen. Suchen Sie eine Plattform, die eine sorgfältig zusammengestellte Auswahl der weltweit besten Modelle bietet, über die Sie mit einem einzigen Klick Bereitstellungen auslösen können und die von Anfang an Sicherheit auf Unternehmensniveau bietet.
Fundierung
Glaubwürdigkeit und Nützlichkeit eines KI-Agents hängen davon ab, ob er korrekte, vertrauenswürdige Antworten auf der Grundlage überprüfbarer Fakten liefern kann. Hier kommt die Fundierung ins Spiel. Sie verwandeln Agenten in echte Workflow-Automatisierer, die auf tiefgehende und korrekte Art auf Ihren Geschäftsdaten aufbauen.
Bei der Fundierung müssen drei Ebenen berücksichtigt werden.
1. RAG: Ein grundlegender erster Schritt
Die Glaubwürdigkeit eines KI-Agents hängt davon ab, ob er Antworten auf der Grundlage überprüfbarer Fakten liefern kann. Retrieval-Augmented Generation (RAG) verbindet einen Agent mit einer Quelle überprüfbarer Echtzeitdaten. So kann der Agent auf der Grundlage von Fakten und nicht von Halluzinationen handeln.
Dieser einfache Prozess des Abrufens und anschließenden Generierens kann auf Text, Bilder und andere Datentypen angewendet werden. Damit lassen sich riesige Datasets blitzschnell durchsuchen, was zu responsiven und zeitnahen Entscheidungen führt.
RAG hilft zwar bei der Beantwortung von Fragen, stößt aber bei komplexen Abfragen an seine Grenzen, die ein tieferes Verständnis der Beziehungen zwischen Datenpunkten erfordern.
2. GraphRAG: Intelligenter fundieren
GraphRAG verbessert die Verankerung, indem es die expliziten Beziehungen zwischen Datenpunkten in einem Knowledge Graph versteht und Kontextdaten abruft, die die Verbindungen zu anderen Datenquellen besser widerspiegeln. Anstatt also nur ähnliche Sätze abzugleichen, versteht Ihr Agent, wie Konzepte zusammenhängen.
Wichtig ist, dass Sie mit Wissensgrafen die direkte Kontrolle über Ihre Geschäftslogik haben. Während sich Standard-RAG auf von Modellen generierte Muster verlässt, können Sie mit einem Knowledge Graph die spezifischen Beziehungen zwischen Entitäten definieren und verwalten. So wird sichergestellt, dass der Agent die einzigartige Taxonomie und die Regeln Ihres Unternehmens berücksichtigt. Für maximale Zuverlässigkeit setzen führende Unternehmen auf einen hybriden Ansatz, bei dem der breitgefächerte Ansatz von Standard-RAG mit der Präzision und Kontrolle von GraphRAG kombiniert wird.
Anwendungsfall
Strukturierte Ansicht von Daten aus unterschiedlichen Quellen
Finanzdienstleister nutzen Wissensgraphen, um Analysten einen einheitlichen Überblick über Analystenberichte, Telefonkonferenzen zu Quartalsergebnissen, Risikobewertungen und mehr zu geben. Dieses umfangreiche, vernetzte Datennetzwerk hilft Analysten, bisher verborgene Erkenntnisse zu gewinnen, z. B. komplexe Abhängigkeiten in der Lieferkette, Überschneidungen bei Vorstandsmitgliedschaften von Wettbewerbern und die Anfälligkeit für komplexe geopolitische Risiken.
3. Agentic RAG: Dynamische Schlussfolgerung und Abruf
Der leistungsstärkste Ansatz für das Grounding ist Agentic RAG, bei dem der Agent nicht mehr nur passiv Informationen empfängt, sondern aktiv und mitdenkend am Abrufprozess beteiligt ist. Mit Agentic RAG kann ein Agent eine komplexe Abfrage analysieren, einen mehrstufigen Plan formulieren und mehrere Toolaufrufe nacheinander ausführen, um die bestmöglichen Informationen zu finden. Das ist kein Ersatz für die herkömmliche Suche, sondern eine Ergänzung Ihrer bestehenden RAG- und Knowledge Graph-Infrastruktur, um komplexe Anfragen zu beantworten.
Durch die Fähigkeit, verschiedene Datentypen zu erkennen und zu verarbeiten, wird der Agent von einem Datenverarbeitungstool zu einem Problemlösungstool, das die Welt umfassender versteht und mit ihr interagiert. Wenn der Agent ein aktiver, denkender Teilnehmer ist, können Entwickler Systeme erstellen, die komplexe, mehrstufige Abfragen und Aufgaben mit langem Horizont ausführen können, die die Agent-Funktionen der nächsten Generation definieren.
Profitipp
Abruf- und Neusortierungsansatz verwenden
Gehen Sie den Kompromiss zwischen Recall (alle relevanten Dokumente finden) und Precision (sicherstellen, dass die abgerufenen Dokumente relevant sind) mit dem Ansatz „Abrufen und neu bewerten“ an, der den Recall-Bereich erweitert, um eine größere als die benötigte Menge an Dokumenten abzurufen. Dieses größere Set wird an das LLM oder einen spezialisierten Re-Ranking-Dienst übergeben, der die relevantesten Dokumente identifiziert und alle irrelevanten oder semantisch gegensätzlichen Dokumente verwirft.
Hinweis
Feinabstimmung ist keine Fundierung. Durch die Feinabstimmung wird der Stil eines Modells angepasst und sein Wissen über eine bestimmte Aufgabe verfeinert. Durch die Fundierung wird das Modell mit überprüfbaren Echtzeit-Datenquellen verbunden, um sicherzustellen, dass die Antworten faktisch korrekt sind.
Tools
Tools sind definierte Funktionen, die es einem Agenten ermöglichen, über die nativen Funktionen seines Kernmodells hinauszugehen. Von einfachen internen Berechnungen bis hin zur Interaktion mit externen Systemen über API-Aufrufe – Tools schließen die Lücke zwischen der Schlussfolgerung des Agenten und seiner Handlungsfähigkeit. Da die Fundierung für Agenten die wichtigste Methode für den Abruf neuer Informationen ist, ist sie technisch gesehen das grundlegendste Tool im Toolkit eines Agenten.
Beispiele:
Datenarchitektur
Agents verwenden unterschiedliche Arten von Speicher für unterschiedliche Aufgaben. Eine robuste Unternehmensdatenarchitektur muss drei unterschiedliche Anforderungen erfüllen: nichtflüchtigen Speicher für den langfristigen Wissensabruf, Zugriff mit niedriger Latenz für den kurzfristigen Konversationskontext und ein dauerhaftes Verzeichnis für die Transaktionsprüfung.
1. Langfristige Wissensdatenbank (Verankerung und Gedächtnis)
Das Langzeitgedächtnis ist die Grundlage für die Intelligenz, die Verankerung und die Personalisierung eines Agenten und unterscheidet sich vom schnellen, kurzfristigen Kontext einer Live-Unterhaltung. Die Architektur besteht aus drei Kernkomponenten:
Anwendungsfall
Zugriff auf alle relevanten Informationen
Ein Rechts-Agent ruft sofort Fallrecht, interne Richtliniendokumente und Schulungshandbücher ab, um einen rechtskonformen ersten Entwurf eines Vertrags zu erstellen.
2. Arbeitsspeicher (Konversationskontext und kurzfristiger Zustand)
Diese Ebene verwaltet die temporären Informationen (das Kontextfenster des LLM), die für eine laufende Aufgabe oder Unterhaltung erforderlich sind. Um eine responsive Nutzung zu gewährleisten, muss der Zugriff auf die iterative Abfolge von Aktionen und Beobachtungen mit extrem niedriger Latenz erfolgen.
Anwendungsfall
Hilfreiche Unterhaltungen führen
Ein Kundensupport-Agent verwaltet den Status eines mehrstufigen Ablaufs zur Fehlerbehebung und merkt sich die zuvor angegebenen Seriennummern oder Diagnoseschritte, um Wiederholungen zu vermeiden.
3. Transaktionsspeicher (Zustandsverwaltung und Aktionsprüfung)
Diese Ebene ist für das Aufzeichnen von Aktionen und Zustandsänderungen mit strikter Konsistenz und Integrität verantwortlich. Es dient als dauerhaftes System für Aufzeichnungen, was aus Sicherheitsgründen und für die Bereitstellung eines verlässlichen Audit-Trails für jede durch einen Agenten ausgelöste Aktion unerlässlich ist.
Anwendungsfall
Ein dauerhaftes Verzeichnis führen
Ein Supply-Chain-Agent zeichnet die erfolgreiche Ausführung eines komplexen, mehrteiligen Auftrags auf und sorgt dafür, dass die Transaktion dauerhaft in allen Finanzsystemen nachverfolgt und verifiziert werden kann.
Orchestrierung
Die Orchestrierung ist der operative Kern, der einen Agenten durch eine mehrstufige Aufgabe führt. Für jeden Prozess, der mehr als eine Aktion erfordert, wird festgelegt, welche Tools in welcher Reihenfolge benötigt werden und wie ihre Ausgaben kombiniert werden sollten, um ein Endergebnis zu erzielen.
Als wichtige Funktion der Agenten ist die Orchestrierung bei der Schaffung komplexe Geschäftsprozesse automatisierenden Systemen von größter Wichtigkeit. Sie erlaubt es, zuvor technisch nicht lösbare Probleme anzugehen und letztlich eine neue Klasse von Anwendungen und Nutzererlebnissen schaffen.
Ein häufig verwendetes und effektives Orchestrierungsmuster ist ReAct (Reason + Action). Dieses Framework kombiniert die Schlussfolgerungs- und Handlungsfähigkeiten von Large Language Models und schafft eine dynamische, mehrstufige Schleife, in der das Modell sowohl Schlussfolgerungsspuren (Gedanken) als auch aufgabenspezifische Aktionen ineinandergreifend generiert.
Mit ReAct kann das Modell mithilfe der Schlussfolgerungen Aktionspläne verfolgen und aktualisieren, während Aktionen Informationen aus externen Tools erfassen, um den Schlussfolgerungsprozess zu unterstützen. So funktionierts:
Anwendungsfälle
Abteilungsübergreifende Automatisierung von HR-Prozessen
Um einen neuen Mitarbeiter einzuarbeiten, initiiert der Agent sequenziell Aktionen in mehreren Systemen. Zuerst wird ein Mitarbeiterdatensatz im System erstellt, dann wird ein API-Aufruf an den IT-Agenten ausgelöst, um Hardware und Netzwerkanmeldedaten bereitzustellen, und schließlich wird der Mitarbeiter in den erforderlichen regionalen Compliance-Schulungsmodulen angemeldet.
Proaktive Korrektur der Lieferkette
Um Versandunterbrechungen automatisch zu erkennen und zu beheben, wird ein Agent so orchestriert, dass er die wichtigsten Schritte ausführt. Zuerst löst eine Monitoring-Warnung ein Tool aus, das alternative Lieferanten abfragt. Anschließend wird mit einem Simulationstool das Kosten-Nutzen-Verhältnis eines Lieferantenwechsels im Vergleich zu einer verzögerten Lieferung berechnet. Wenn die Aktion von einem Human-in-the-Loop genehmigt wurde, wird sie ausgeführt und ein neuer Kaufauftrag an den Logistikdienstleister gesendet.
Laufzeit
Um einen funktionsfähigen Agent-Prototyp in einer Produktionsumgebung in großem Maßstab bereitzustellen, benötigen Sie eine robuste Laufzeitinfrastruktur, die in ein zusammenhängendes System von Diensten für Grounding, Tools, Speicher, Sitzungen und den Rest eingebunden ist. So können Ihre Agents in einer sicheren, leistungsstarken Umgebung arbeiten, die die komplexen Anforderungen des globalen Unternehmenswachstums bewältigen kann.
Eine für die Produktion geeignete Laufzeitumgebung erfordert:
Skalierbarkeit: Die Infrastruktur muss automatisch skaliert werden, um variable Lasten zu bewältigen, von null bis zu Millionen von Anfragen. Dazu gehören sowohl das anfragebasierte Load Balancing als auch das ressourcenbasierte Autoscaling, um die Rechenanforderungen effizient zu verwalten.
Sicherheit und Kontrolle: Die Plattform muss eine sichere Ausführungsumgebung bieten, in der die Identität von Nutzern und Agents, Organisationsrichtlinien, Tool- und Agent-Registrierungen, Netzwerkzugriffssteuerungen und sichere Kommunikationskanäle (z. B. TLS) verwaltet werden, um den Agent und die von ihm aufgerufenen Daten zu schützen.
Zuverlässigkeit und Beobachtbarkeit: Das System muss Mechanismen für die Fehlerbehandlung und das kontinuierliche Monitoring umfassen. Für komplexes Debugging muss die Laufzeit hochgenaue Ausführungstraces erfassen – eine Schritt-für-Schritt-Aufzeichnung der Schlussfolgerungen des Agents und der Tool-Aufrufe. So wird der gesamte Entscheidungsprozess sichtbar, sodass Ihre Teams bei einem unerwarteten Fehler die Frage „Warum?“ beantworten können. Für eine allgemeine Übersicht muss das System Messwerte zur Aufgabenerfüllung und Nutzerfeedback enthalten. Automatisierung mit Simulationen und Bewertungen schafft Vertrauen vor und nach der Bereitstellung in der Produktion.