Die Meinungen dazu, wie intelligent die Künstliche Intelligenz ist, gehen weit auseinander. Zwar meistern neueste Modelle mittlerweile nicht nur gängige Maturaprüfungen, sondern schaffen bereits Aufnahmetests an renommierten Universitäten. Doch die verschiedenen KI-Services à la ChatGPT, MS Copilot oder Gemini sind noch immer in Logik, Autonomie sowie Entscheidungsfähigkeit und damit eigenständigem Handeln eingeschränkt. Das könnte sich jedoch bald ändern. Denn die Entwicklung von KI-Systemen transformiert sich derzeit in Windeseile von Task-spezifischen, statischen AI-Agenten, die menschlichen Input benötigen (Prompts), hin zu interaktiven und selbstlernenden Agenten. Diese können sich dank einer höheren Stufe an Autonomie der Umgebung anpassen und kommen mit ihrem Reifegrad einer «Allgemeinen Künstlichen Intelligenz» (Artificial General Intelligence, AGI) wieder einen Schritt näher. Die AGI ist laut OpenAI-Gründer Sam Altman in der Lage, ökonomisch wertvolle Arbeit ebenso kreativ, intelligent und flexibel wie ein Mensch, wenn nicht sogar besser, zu erledigen.
Task-spezifische KI vs. Agenten-Generalisten
Task-spezifische KI wird heutzutage auch in der Finanz- und Versicherungswirtschaft bereits breit genutzt. Sie dient der Automatisierung einfacher, strukturierter Tasks; die meisten im Einsatz stehenden Chatbots sind ein gutes Beispiel dafür. Sie werden mit Wissen zu Daten und Workflows gefüttert und handeln in dem ihnen vorgegebenen Rahmen, wodurch sie zwar wertvolle Fachkräfte entlasten und für Effizienzsteigerungen sorgen – allerdings entscheiden sie nur nach vorprogrammiertem Schema und können sich nur in engen Limiten an neue Situationen anpassen.
Agentic AI entwickelt sich in Richtung Agenten-Generalisten, die neue Fähigkeiten beherrschen, die ihr Lernen, Entscheiden und Handeln hochgradig von menschlichen Eingriffen entkoppeln. Sie basieren auf multimodalen Systemen, die effizient eine grosse Menge an verschiedensten (Umgebungs-)Daten verarbeiten und daraus eine grosse Breite an agentenbasierten multimodalen Interaktionen ableiten können. Die Daten können Text, aber auch Video oder Robotics-Sequenzen sein (daher: multimodal).
Ein hohes Mass an Autonomie
Generell ist der KI eigen, dass sie dem Menschen weit überlegen ist, grosse Datenmengen in kürzester Zeit zu verarbeiten. Neue KI-Modelle ermöglichen AI-Agenten mit einem höheren Mass an Autonomie, so dass sie nicht ständig mit dem Menschen interagieren müssen. Arbeitsschritte werden eigenständig geplant und abgearbeitet.
Gemessen wird die Leistungsfähigkeit einer KI am «General AI Assistant (GAIA)» Benchmark. Auf niedrigstem Level stehen KI-Modelle, die in der Lage sind, Aufgaben zu erledigen, die keine oder höchstens ein Werkzeug erfordern und in maximal fünf Schritten lösbar sind. Auf Level 2 heben sich KIs bei Aufgaben, für die sie fünf bis zehn Schritte benötigen und mehrere Werkzeuge kombinieren müssen. Level 3 schliesslich setzt ein allgemeines Verständnis der Welt voraus, um sich mit Aufgaben befassen zu können, für die die Anzahl an Arbeitsschritten und Werkzeugen unlimitiert sind. Neueste KI-Modelle rücken menschlicher Intelligenz bereits recht nahe, indem sie auf Level 1 bei über 80 (vs. Mensch: 100), auf Level 2 bei 70 (vs. Mensch: 92) und Level 3 fast 60 (Mensch: 87) Prozent erreichen.

Quelle: Huggingface.co, eine führende und vertrauenswürdige Plattform für Informationen und Updates aus der Welt der Künstlichen Intelligenz
Funktionsweise von Agentic AI
Ein interaktiver KI-Agent durchläuft bei der Aufgabenabwicklung die vier Schritte: wahrnehmen, verstehen, agieren, lernen. Zunächst sammelt er Daten aus der (direkten) Umgebung. Er verarbeitet diese, um zu verstehen, was geschieht. Darauf aufbauend entscheidet er über die angemessene Reaktion. Daraus wiederum zieht er Lehren und passt sein Handlungsrepertoire an bzw. erweitert seinen «Erfahrungsschatz».
Um KI auf dieses Niveau zu bringen, bietet sich der Ansatz an, vortrainierte Language- und Visual-Language-Modelle zu nutzen und diese kombiniert zu einem neuen Interactive Agent Foundation Model zu trainieren sowie mit multimodalen Fähigkeiten auszustatten.
Noch ist es ein grösserer Schritt von Task-spezifischen zu vollwertig autonom handelnden KI-Agenten, wobei mit manus.ai gerade kürzlich bereits eine sehr fortschrittliche und erstaunlich ausgereifte Beta-Version verfügbar wurde. Das Marktforschungsunternehmen Gartner geht davon aus, dass von heute einem Prozent im Jahr 2028 bereits über 33 Prozent der Enterprise-Software-Applikationen Agentic AI enthalten und um die 15 Prozent der täglichen Arbeitsentscheidung autonom durch KI getroffen werden.
Risiken und Chancen
Nach wie vor stellen sich bei KI viele ethische, Compliance- und Vertrauensfragen. Basieren die Modelle auf schlechter Qualität, sind auch die Ergebnisse nicht glaubwürdig. Ein Problem liegt auch darin, dass KI falsche Antworten mit grosser Selbstsicherheit verkündet; sie «halluziniert». Die NZZ zog in einem kürzlich veröffentlichten Artikel zu AGI das Fazit: «…die meisten Nutzer würden sich wohl eher für das KI-Modell entscheiden, das am wenigsten Fakten erfindet, als für das Modell, das die Anatomie eines Kolibris am genausten kennt.»
Sind diese Hürden gemeistert, dann sind unzählige Use Cases denkbar. Uns bei der Inventx interessieren natürlich vor allem Anwendungsszenarien in der Finanz- und Versicherungswirtschaft. Generalisierte AI-Agenten mit neuen multimodalen Modellen ermöglichen höchstpersonalisierte Dienstleistungen in der Finanzberatung, etwa zu Investmentstrategien, die auf Echtzeitdaten und Realtime-Vorhersagen beruhen. Im Bereich Cybersecurity kann Agentic AI potenzielle Threats und Schwachstellen autonom erkennen, analysieren, auf Angriffe reagieren und für die Prävention dazulernen. Dazu ist es jedoch erforderlich, auch die Datenplattform zu modernisieren, worüber wir bereits publiziert haben.
Entlang einer gesamten Customer Journey, in welchem Bereich auch immer, können die Wünsche und Anliegen der Kunden antizipiert und mit Agentic AI in Windeseile proaktiv, automatisiert, dynamisch und smart erfüllt werden.