Agentic AI stützt sich auf die bestehenden Fähigkeiten von großen Sprachmodellen (Large Language Models, kurz: LLMs) und verfolgt einen modularen Ansatz. KI-Agenten führen im Kern drei Schritte aus: Zunächst sammeln sie Informationen – seien es Texte, Bilder, Sensordaten oder Datensätze aus einer Datenbank. Dann machen sie einen Plan, indem sie den Input verarbeiten und auswerten. Im letzten Schritt führen sie Handlungen aus. Dabei greifen sie typischerweise auf eine Reihe von Tools und Programmschnittstellen zurück, die ihnen zur Verfügung stehen.
Die besondere Stärke von agentenbasierten Systemen besteht darin, dass mehrere spezialisierte Agenten in einem Multiagentensystem auf ein übergeordnetes Ziel hinarbeiten können. Darin kann es zum Beispiel Recherche-Bots geben, die bestimmte Informationen einholen und vorverarbeiten. Oder Qualitätssicherungs-Bots, die die Arbeitsergebnisse anderer Bots überprüfen. Das Zielbild solcher orchestrierten Agenten-Ensembles bezeichnet man auch als Agentic Mesh – ein Netzwerk aus miteinander interagierenden Agenten, die in Summe auch sehr komplexe Aufgaben in dynamischen Umgebungen übernehmen können.