Emerging Topic · Gartner Hype Cycle 2026

BPM mit KI-Agenten: die neue Prozessorchestrierung

KI-Agenten verändern BPM grundlegend, weil sie eine Schicht einführen, die innerhalb des Workflows entscheidet, Dokumente liest und argumentiert. Sie lösen, was RPA nicht konnte: Prozesse mit Ermessen, unstrukturierte Daten, Konversation mit dem Nutzer und komplexe Ausnahmen.

Gartner positioniert agentic Prozess-Orchestrierung als einen der dominierenden Trends im Hype Cycle for Process Automation 2026, mit einer Adoptionsprognose von etwa 80 % in mittleren und großen Unternehmen innerhalb der nächsten 18–24 Monate.

Die Frage lautet nicht mehr „Werden wir KI-Agenten einsetzen?", sondern „Wie steuern wir sie, ohne Nachvollziehbarkeit oder menschliche Kontrolle zu verlieren?". Genau hier wird klassisches BPM mit BPMN 2.0 und menschlicher Aufsicht wieder zum strategischen Baustein.

Dieser Leitfaden erklärt, was ein KI-Agent in einem Prozess ist, wie er sich von RPA unterscheidet, fünf reale Use Cases, den zugrundeliegenden Tech-Stack und wie Sie mit einem messbaren Piloten in wenigen Wochen starten.

Executive Summary

Aktualisiert: 14. Mai 2026 · Technische Analyse des Produktteams Dokuflex

1. Was ist ein KI-Agent in einem BPM-Prozess?

Ein KI-Agent ist eine Software-Einheit, die eine Eingabe entgegennimmt (ein Dokument, eine Nachricht, ein Ereignis, ein Datensatz), mithilfe eines Sprachmodells (LLM) argumentiert und eine strukturierte Ausgabe erzeugt, die der Prozess konsumieren kann: eine Klassifikation, ein extrahiertes Feld, eine begründete Entscheidung oder eine konversationelle Antwort. Anders als ein klassischer Microservice folgt der Agent keinem geschlossenen Algorithmus; er wendet einen trainierten Skill an und passt sich dem bereitgestellten Kontext an.

Innerhalb eines BPM lebt dieser Agent als ein weiterer Prozessschritt. Eine Eingangsrechnung tritt in den Flow ein, eine automatische BPMN-Task ruft den Agenten „Rechnungsklassifizierer" auf, der Agent liefert zurück: {typ: "energie", lieferant: "E.ON", konfidenz: 0.94}, und die nächste Task entscheidet, ob automatisch freigegeben oder an einen Menschen eskaliert wird. Alles wird im Prozess-Log dokumentiert.

Der Unterschied zu einem „Bot" oder zu RPA ist grundlegender Natur: Ein Bot führt eine feste Sequenz von Schritten aus, RPA imitiert die Interaktion eines Menschen mit einer UI, und ein KI-Agent entscheidet mit Ermessen über unstrukturierten Daten. Letzteres öffnet die Tür zu Prozessen, die bisher ohne manuellen Eingriff nicht handhabbar waren: einen Vertrag lesen, eine E-Mail klassifizieren, eine Gehaltsabrechnung interpretieren oder beurteilen, ob eine Ausnahme legitim ist.

2. RPA vs KI-Agenten: der zentrale Unterschied

Es handelt sich nicht um konkurrierende Technologien; sie decken unterschiedliche Anwendungsfälle ab. Die Faustregel: RPA für deterministische Aufgaben mit stabiler UI; KI-Agent für Aufgaben mit Ermessen oder unstrukturierten Daten.

Merkmal RPA KI-Agent
Natur Deterministisch. Führt feste Klicks und Sequenzen aus. Argumentierend. Entscheidet abhängig vom Kontext.
Daten Strukturiert (Formulare, Tabellen, Felder). Mix: strukturiert + unstrukturiert (PDFs, E-Mails, Sprache).
Anpassung Keine. Wenn die UI sich ändert, bricht das Skript. Ja, an den Kontext. Toleriert Eingabevariabilität.
Nachvollziehbarkeit Ausführungs-Logs (welcher Klick, wann). Logs + Reasoning Trace (was entschieden, warum).
Wartung Hoch bei UI- oder Quellsystem-Änderungen. Gering bei LLM-Verbesserungen; nur Prompts und Regeln werden justiert.
Wann einsetzen Starre repetitive Prozesse mit stabiler UI. Prozesse mit Entscheidung, Leseverständnis oder Kontext.

In der Praxis koexistieren beide: Ein realer Prozess kombiniert KI-Agenten für Leseverständnis und Entscheidung, RPA oder API-Konnektoren zur Datenbewegung zwischen Systemen und ein BPM, das alles orchestriert.

3. Typen von KI-Agenten im BPM

Nicht alle Agenten erfüllen dieselbe Funktion. In einem produktiven BPM koexistieren vier typische Kategorien, jede mit eigenem spezialisiertem Skill, eigenen Erfolgsmetriken und Integrationsmuster im Prozess.

Klassifizierungs-Agent

Klassifiziert Eingaben nach Geschäftstaxonomien: Rechnungen (Energie, Telekommunikation, Material), Verträge (NDA, Arbeitsvertrag, Lieferantenvertrag), eingehende E-Mails (Beschwerde, Vertrieb, HR), Support-Tickets. Die Ausgabe leitet in den richtigen Flow und erspart das manuelle Triaging.

Extraktions-Agent

Liest PDFs, Bilder oder E-Mails und extrahiert Schlüsselfelder: Beträge, IBAN, USt-ID, Fälligkeitsdaten, Klauseln. Es handelt sich um IDP (Intelligent Document Processing) ohne Templates: lernt jedes Lieferantenformat zu lesen, ohne manuelle Konfiguration.

Entscheidungs-Agent

Empfängt Prozessdaten und schlägt eine Empfehlung mit Begründung vor: Rechnung freigeben, Urlaubsantrag ablehnen, Incident eskalieren, Neukunden-Anlage akzeptieren. Stets mit nachvollziehbarem Reasoning; nie als Black Box. Der Mensch validiert oder überschreibt per Klick.

Konversations-Agent

Führt einen Dialog mit Kunde oder Mitarbeiter innerhalb des Workflows: fragt fehlende Daten ab, beantwortet Fragen auf Basis der Wissensdatenbank, validiert eine Identität oder holt eine Unterschrift ein. Der Front-End des Prozesses für Fälle, in denen ein starres Formular zu Abbrüchen führt.

4. 5 reale Use Cases von BPM mit KI-Agenten

Diese fünf Szenarien konzentrieren den Großteil des Wertbeitrags von KI-Agenten in der Prozessautomatisierung. Sie teilen das gleiche Muster: hohes Volumen, repetitive Entscheidung mit Ermessen, unstrukturierte Daten und Anforderung an Nachvollziehbarkeit.

1

Lieferantenrechnungen

Agenten in Serie: Klassifizierer (welcher Rechnungstyp) → Extraktor (Betrag, USt., IBAN, USt-ID des Ausstellers, Fälligkeit) → Entscheidung (freigeben, wenn Betrag < 1.000 € und Lieferant wiederkehrend; sonst an Manager eskalieren).

Typisches Ergebnis: 65–80 % der Rechnungen werden ohne Berührung freigegeben; der Rest geht an den Menschen mit bereits extrahiertem Kontext. Engpass beseitigt.

2

Kunden-Onboarding (Banken, Versicherungen, Telko)

Agenten parallel: Extraktor auf Personalausweis/Reisepass + KYC-Agent (Abgleich gegen Sanktionslisten, PEP, Compliance) + Konversations-Agent zum Erfragen fehlender Daten + Entscheidung „automatische Anlage" oder „Analystenprüfung".

Die Anlage verkürzt sich von 3–7 Tagen auf Stunden. Compliance wird Schritt für Schritt für die Aufsichtsbehörde dokumentiert.

3

Kundenservice

Agenten in Kaskade: Klassifizierer (Beschwerde, Vertrieb, HR, Sonstiges) → Routing an das richtige Team → Konversations-Agent mit Wissensdatenbank (FAQ + frühere Tickets) → automatische Antwort bei gelösten Fällen → Eskalation an Menschen bei sensiblen Fällen oder Premium-Kunden.

Die Erstantwortzeit sinkt auf Minuten; die Last im Level 1 reduziert sich drastisch; menschliche Agenten konzentrieren sich auf Fälle, in denen sie wirklich Mehrwert bringen.

4

HR: Urlaub, Krankmeldung und Einstellungen

Agenten: Triaging des Antragstyps → dokumentenbasierte Prüfung (Extraktor auf ärztlichen Bescheinigungen, Familienzeugnissen) → Validierung gegen geltenden Tarifvertrag (convenio colectivo bei spanischen Operationen) → Entscheidung „automatische Freigabe" oder „Eskalation an direkten Vorgesetzten".

Das HR-Team wird vom administrativen Workflow entlastet und fokussiert sich auf Beziehung, Talententwicklung und sensible Fälle.

5

Compliance: Vertragsprüfung

Agenten: Extraktor auf dem Vertrag → Detektor kritischer Klauseln (Haftungsbeschränkung, Gerichtsstand, Wettbewerbsverbot, personenbezogene Daten) → Vergleich gegen genehmigte Mustervorlage → Abweichungsbericht für das Legal-Team.

Der Jurist erhält einen vorgeprüften Bericht statt eines leeren PDF. Die Prüfung verkürzt sich von Stunden pro Vertrag auf Minuten, ohne Rigorositätsverlust.

5. BPMN 2.0 Governance: wie KI-Agenten gesteuert werden

Der BPMN-2.0-Standard verfügt bereits über die passende Primitive: die Service Task. Ein KI-Agent wird als Service Task mit spezifischer Konfiguration modelliert: Skill (klassifizieren, extrahieren, entscheiden, konversieren), Prompt oder Geschäftsanweisung, Kontextdaten, die aus dem Prozess empfangen werden, erwartete Ausgabe mit ihrem Schema (typisiertes JSON) und Fallback-Strategie, falls der Agent nicht mit ausreichender Konfidenz antwortet.

Das BPM behält drei Verantwortlichkeiten, die der Agent allein nicht abdecken kann. Erstens, Orchestrierung: welcher Agent in welcher Reihenfolge mit welchen Daten aufgerufen wird und was mit seiner Ausgabe geschieht. Zweitens, Nachvollziehbarkeit: jeder Aufruf wird mit Zeitstempel, Eingabe, Ausgabe, verwendetem Modell, Kosten und Konfidenzniveau protokolliert. Drittens, menschliche Aufsicht: der Flow entscheidet auf Basis von Regeln (Betrag, Risiko, Konfidenz, Kundentyp), wann an eine Person eskaliert wird.

Diese Architektur erlaubt das Versionieren von Prozessen wie Code: Wenn ein Prompt verbessert oder das Modell gewechselt wird, ist dies in der neuen BPMN-Version dokumentiert. Laufende Instanzen werden mit der alten Version zu Ende geführt; neue Instanzen übernehmen die aktualisierte Version. Ohne dies ist ein KI-Agent „in Produktion" auf Skala nicht steuerbar. Diese Anforderung deckt sich mit ISO/IEC 42001 (AI Management System), die ein nachvollziehbares Lifecycle-Management für KI-Komponenten vorschreibt.

6. Nachvollziehbarkeit und menschliche Aufsicht (Human-in-the-Loop)

In jedem produktiven Prozess mit Geschäftsentscheidungen ist menschliche Aufsicht kein Nice-to-have: Sie ist eine Governance-Pflicht und in vielen Sektoren (Banken, Gesundheit, Versicherungen, öffentlicher Sektor) auch eine gesetzliche Anforderung. Die EU-KI-Verordnung (Verordnung (EU) 2024/1689) bekräftigt explizit die Notwendigkeit signifikanter menschlicher Aufsicht für Hochrisiko-Systeme (Art. 14). Ergänzend regelt Art. 22 DSGVO automatisierte Einzelentscheidungen mit rechtlicher Wirkung.

Das Human-in-the-Loop-Muster in einem BPM mit Agenten funktioniert wie folgt: Jeder Agent liefert neben seiner Ausgabe auch ein Konfidenzniveau (0–1). Übersteigt die Konfidenz den konfigurierten Schwellwert (z. B. 0,85), läuft der Prozess automatisch weiter. Liegt sie darunter, leitet der Flow die Task in eine menschliche Bearbeitungs-Inbox um, mit gesamtem Kontext: ursprüngliche Eingabe, Vorschlag des Agenten, Begründung und Vergleichsdaten.

Der vollständige Audit Trail umfasst: Zeitstempel jedes Aufrufs, verwendetes LLM-Modell, Prompt-Version, exakt gesendete Eingabe (anonymisiert, falls personenbezogene Daten enthalten sind), strukturierte Ausgabe, Konfidenz, finale Entscheidung (automatisch oder menschlich) und Identität des Entscheiders, falls menschlich. Dieser Datensatz erlaubt Monate später die Beantwortung interner Audits oder regulatorischer Anfragen.

Ohne explizite Nachvollziehbarkeit der Agenten-Argumentation und ohne schwellwertbasierte Eskalation an den Menschen gibt es kein produktives KI-Projekt. Es gibt nur eine Demo.

7. Der Tech-Stack: 5 Schichten eines KI-Agenten im BPM

Ohne tief in Code einzutauchen, so ist ein produktiver KI-Agent innerhalb eines BPM aufgebaut. Fünf Schichten, die je nach Use Case ausgewählt und kombiniert werden.

Schicht 1

LLM (Sprachmodell)

Die Argumentations-Engine: GPT (OpenAI/Azure), Claude (Anthropic), Gemini (Google) oder Open-Source-Modelle für On-Premise-Deployment (Llama, Mistral). Multi-Modell-Fähigkeit ermöglicht Wahl nach Kosten, Latenz und Datensouveränität.

Schicht 2

Vector Store + RAG

Eine Vektordatenbank speichert das Unternehmenswissen (Handbücher, Verträge, FAQs, vergangene Fälle) in einer Form, die das LLM abfragen kann. RAG (Retrieval-Augmented Generation) ruft Relevantes vor dem Reasoning ab und verhindert Halluzinationen.

Schicht 3

Tools / Funktionen

Der Agent kann Systemaktionen aufrufen: ERP abfragen, Kunde aus dem CRM lesen, REST-API aufrufen, IBAN prüfen, Dokument generieren. Jedes Tool hat einen klaren Input/Output-Vertrag.

Schicht 4

Geschäftsregeln

Decision Tables, DMN oder codierte Regeln, die die Agenten-Ausgabe vor der Ausführung validieren oder einschränken. Beispiel: „nur freigeben, wenn Betrag < 1.000 € und Lieferant in Whitelist". Das deterministische Sicherheitsnetz, das das LLM absichert.

Schicht 5

BPM + Audit Trail

Die Schicht für Orchestrierung, Governance und Nachvollziehbarkeit. Das BPMN definiert Reihenfolge, menschliche Eskalation, SLAs, Versionen und Logs. Sie verwandelt den Tech-Stack in einen prüfbaren Geschäftsprozess. Diese Schicht bringt KI-Agenten in Einklang mit ISO/IEC 42001 und der EU-KI-Verordnung.

8. ROI-Spannweiten und Messmethodik

Der ROI eines BPM-Projekts mit KI-Agenten ist keine einzelne Kennzahl; er hängt vom Prozess, vom Volumen und vom vorherigen menschlichen Aufwand ab. Die in realen Projekten beobachteten Spannweiten bewegen sich in folgenden Größenordnungen (Richtwerte, keine Garantie):

Zur Messung wird eine Baseline vor Projektstart benötigt. Wird der Prä-Agent-Prozess (Zeit, Fehler, Kosten, Zufriedenheit) nicht gemessen, lässt sich der ROI hinterher nicht nachweisen. Daher umfasst ein gut geführter Pilot stets 4–8 Wochen Baseline-Erfassung, bevor der Agent produktiv geschaltet wird.

9. KI-Agenten Enterprise Prozess-Automatisierung: wie starten

Beginnen Sie nicht mit dem komplexesten Prozess oder dem mit dem höchsten versprochenen Impact. Beginnen Sie mit dem messbarsten und mit dem geringsten Ausnahmenrisiko. Fünf Schritte:

1

Kandidatenprozess identifizieren

Hohes Volumen, repetitive Entscheidung mit Ermessen, unstrukturierte Daten und klare Vorher/Nachher-Metriken. Rechnungen und Ticket-Triaging sind die Favoriten.

2

Agenten-Skill definieren

Klassifiziert, extrahiert, entscheidet oder konversiert er? Welche Eingabe empfängt er? Welche strukturierte Ausgabe liefert er? Welche minimale Konfidenz fordert er vor dem Handeln?

3

BPMN mit Schritt „KI-Agent" konfigurieren

Modellieren Sie den Flow in BPMN 2.0, fügen Sie die Service Task des Agenten hinzu, verbinden Sie Input/Output mit den Nachbarschritten, definieren Sie Eskalationsregeln und SLAs.

4

Pilot mit 100 % menschlicher Aufsicht

Während 4–8 Wochen schlägt der Agent vor, aber der Mensch validiert jede Entscheidung. Dies erlaubt das Justieren von Prompt, Regeln und Schwellwerten auf echten Daten ohne Risiko.

5

KPIs aktivieren und skalieren

Wenn die Genauigkeit stabil ist, heben Sie schrittweise den Automatisierungsschwellwert an. Messen Sie Durchlaufzeit, Fehler und Kosten vor/nach. Wiederholen Sie das Muster mit dem nächsten Prozess.

10. Risiken und Mitigationen

KI-Agenten in Produktion bringen reale Risiken. Die gute Nachricht: Sie sind gut identifiziert und verfügen über etablierte Mitigationen.

Risiko

LLM-Halluzinationen

Das Modell „erfindet" ein Datum, das nicht in der Eingabe enthalten ist.

Mitigation:

RAG über überprüfbare Quellen, Validierung mit Geschäftsregeln vor Aktion, Eskalation an Menschen bei niedriger Konfidenz und Prompts, die Quellenangabe einfordern.

Risiko

Sensible Daten und DSGVO

Personenbezogene oder vertrauliche Informationen werden an ein externes LLM gesendet.

Mitigation:

Deployment mit Daten in der EU, Auftragsverarbeitungsvertrag (AVV) mit dem LLM-Anbieter, Verschlüsselung in Übertragung und Speicherung, Pre-Prompt-Anonymisierung wo anwendbar und On-Premise-Modell-Option für kritische Fälle.

Risiko

Abhängigkeit vom externen LLM

Preis-, Richtlinien- oder Verfügbarkeitsänderung des Anbieters.

Mitigation:

Multi-Modell-Architektur (GPT, Claude, Gemini, Open Source) mit Anbieter-Abstraktion, portable Prompts und Möglichkeit zum automatischen Fallback auf ein Alternativmodell.

Risiko

Bias und unfaire Entscheidungen

Der Agent diskriminiert aufgrund vom Modell oder aus Daten geerbter Bias.

Mitigation:

Regelmäßige Audit der Entscheidungen, Fairness-Metriken pro Segment, verpflichtende menschliche Aufsicht bei Entscheidungen mit Rechtsfolge (EU-KI-Verordnung Art. 14) und periodische Überprüfung des Prompts sowie der in RAG verwendeten Trainingsdaten.

Häufig gestellte Fragen

Worin unterscheidet sich ein KI-Agent von klassischem RPA?

Ein RPA führt deterministische Klicks auf Benutzeroberflächen aus; bricht, wenn sich die UI ändert, und trifft keine Entscheidungen. Ein KI-Agent argumentiert über strukturierte und unstrukturierte Daten, entscheidet mit Begründung und passt sich an den Kontext an. RPA eignet sich für starre, repetitive Aufgaben; der KI-Agent für Prozesse mit Ermessen, Dokumentenverarbeitung oder Konversation.

Kann ich KI-Agenten ohne Programmierkenntnisse einsetzen?

Ja. In Dokuflex wird ein KI-Agent als Prozessschritt in BPMN konfiguriert: Sie wählen den Skill (klassifizieren, extrahieren, entscheiden, konversieren), definieren den Prompt und die Kontextdaten und verbinden die Ausgabe mit dem nächsten Schritt. Kein Code erforderlich; jedoch sind Prozessdesign und menschliche Validierung im Pilot notwendig.

Sind KI-Agenten DSGVO-konform?

Sie sind DSGVO-konform, wenn die Daten in der EU verarbeitet werden, Verschlüsselung in Übertragung und Speicherung gewährleistet ist, die Verarbeitung nachvollziehbar dokumentiert und die Rechtsgrundlage belegt ist. Für automatisierte Entscheidungen mit erheblichen rechtlichen Auswirkungen (Art. 22 DSGVO) ist signifikante menschliche Aufsicht zwingend. Die EU-KI-Verordnung (2024/1689) ergänzt für Hochrisiko-Systeme zusätzliche Anforderungen.

Wie verhindert man Halluzinationen bei kritischen Entscheidungen?

Mit drei Schichten: RAG (Retrieval-Augmented Generation), damit der Agent nur auf nachweisbaren Daten antwortet; Geschäftsregeln, die die Ausgabe vor der Ausführung validieren; und Human-in-the-Loop mit Vertrauensschwellwert, der jeden zweifelhaften Fall an einen menschlichen Prüfer eskaliert. Die Nachvollziehbarkeit der Argumentation des Agenten wird im Prozess-Log gespeichert.

Ersetzen KI-Agenten Mitarbeitende?

In den realen Szenarien nicht. Agenten übernehmen den repetitiven Teil mit geringer Wertschöpfung (klassifizieren, extrahieren, Entwurf erstellen) und überlassen dem Menschen die finale Entscheidung, die Ausnahmebehandlung und die Kundenbeziehung. Was sich ändert, ist die Kapazität: ein gleiches Team bewältigt ein Vielfaches an Volumen ohne Qualitätseinbußen.

Welches LLM nutzt Dokuflex?

Dokuflex ist multi-modell-fähig: integriert GPT (OpenAI/Azure), Claude (Anthropic) und Open-Source-Modelle, die in privater Infrastruktur deploybar sind. Der Kunde kann nach Kosten, Latenz, Datensouveränität oder On-Premise-Anforderung wählen. Dies vermeidet Anbieterabhängigkeit (Vendor Lock-in).

Wie wird die Nutzung von KI-Agenten abgerechnet?

Nach gemessenem Verbrauch (Tokens oder Agenten-Ausführungen) zuzüglich der BPM-Lizenz. In Dokuflex erfolgt die Abrechnung pro Prozess oder pro Ausführungsvolumen mit Kostenprognose pro Arbeitseinheit. Für Enterprise-Umgebungen wird ein Jahres-Festpreis mit gedeckeltem Token-Budget angeboten.

Benötige ich ein BPMS für den Einsatz von KI-Agenten?

Technisch lässt sich ein einzelner KI-Agent aus einem Skript heraus aufrufen. Ohne BPMS fehlen jedoch Orchestrierung, Nachvollziehbarkeit, menschliche Aufsicht und Versionsverwaltung. Das BPMS ist das, was einen isolierten KI-Agenten in einen produktiven, prüfbaren und wartbaren Prozess verwandelt. Es ist der Unterschied zwischen Demo und Produktion.

Quellen und Referenzen

Allgemeine Informationen ohne Rechtscharakter. Adoptionskennzahlen und ROI-Spannweiten sind Marktschätzungen und typische beobachtete Ergebnisse; sie stellen keine Ergebnisgarantie dar. Für konkrete Fälle wenden Sie sich bitte an Ihr IT- und Compliance-Team.

Automatisieren Sie Ihre Prozesse mit KI-Agenten, gesteuert durch BPM

Modellieren Sie den Flow, integrieren Sie KI-Agenten dort, wo sie Mehrwert liefern, behalten Sie die menschliche Aufsicht und messen Sie die Wirkung ab dem ersten Piloten.

✓ BPMN 2.0 Standard ✓ Multi-Modell-LLM ✓ Daten in der EU ✓ Vollständiger Audit Trail