Seit Juli 2025 existiert Annex 22 — das erste dedizierte GMP-Regelwerk für künstliche Intelligenz in der Pharmaproduktion. Am 12. Mai kündigte SAP auf der Sapphire-Konferenz in Orlando eine strategische Beteiligung an n8n an — einem Berliner Workflow-Plattform-Unternehmen, dessen Lösung ab Q3 2026 nativ in SAP's Joule Studio integriert wird. Für die Pharmabranche markiert dies eine Architekturentscheidung mit direktem Einfluss auf die praktische Umsetzung von Annex 22.
Was Annex 22 von der Industrie verlangt
Die EMA hat mit Annex 22 zum EU-GMP-Leitfaden erstmals ein Rahmenwerk geschaffen, das sich ausschließlich mit KI und Machine Learning in der Arzneimittelherstellung befasst. Die zentrale Unterscheidung erfolgt zwischen kritischen und nicht-kritischen GMP-Anwendungen:
- Modelltyp-Beschränkung: In kritischen GMP-Anwendungen sind ausschließlich statische, deterministische Modelle zulässig. Probabilistische Modelle, dynamisch lernende Systeme, Generative AI und LLMs sind ausdrücklich ausgeschlossen.
- Intended Use: Jedes KI-System erfordert dokumentierte Zweckbestimmung — Funktionsumfang, Daten, Einsatzbedingungen — vor produktivem Einsatz.
- Validierung über den Lebenszyklus: Kontinuierliches Performance-Monitoring ist erforderlich. Ändern sich Daten oder Modellparameter, muss die Validierung nachgeführt werden.
- Human-in-the-Loop: Für ausreichend getestete, deterministische Modelle in kritischen Anwendungen ist HITL nicht zwingend. Eine explizite HITL-Pflicht gilt für den Einsatz von Generativer KI in nicht-kritischen Anwendungen.
- Explainability und Traceability: Modelle müssen nachvollziehbar sein. Vollständige Rückverfolgbarkeit über Eingabedaten, Modellversion, Ergebnis und Freigabe ist durchgängig sicherzustellen.
Warum die SAP-Beteiligung regulatorisch relevant ist
n8n verbindet deterministische Automation mit agentischen KI-Fähigkeiten. Jan Oberhauser, Gründer und CEO, beschreibt den Ansatz: „Manche Arbeit ist deterministisch — ein richtiger Ausgang, alles andere ist Fehler. Der Rest ist nicht-deterministisch."
Diese Unterscheidung spiegelt exakt die Grenze wider, die Annex 22 zieht. Drei Anwendungsfälle illustrieren dies:
- Chargenfreigabe — kritische GMP-Anwendung. Ausschließlich statische, deterministische Modelle. KI-Agenten und LLMs sind kategorisch ausgeschlossen. Der Prozess transportiert Daten deterministisch, eine autorisierte Person signiert.
- Abweichungsanalyse — als nicht-kritische Anwendung dürfen LLM-gestützte Werkzeuge einen Berichtsentwurf erstellen — unter striktem HITL. Die finale Verantwortung verbleibt beim Qualitätsverantwortlichen.
- Validierungsdokumentation — nicht-kritisch, sofern der Entwurf keinen direkten Einfluss auf Freigabeentscheidungen hat. Ein maschinell erstellter Entwurf unter HITL ist vertretbar. Eine automatisch freigegebene FS ist es nicht.
Drei Fragen für IT, QA und Fachbereich
Erstens: Wo endet der validierte Prozess — und wo beginnt die technische Integration? Fachlogik gehört in eine orchestrierende Schicht mit eigenem Audit-Trail. Technische Datentransporte gehören in eine gekapselte Integrations-Schicht. SAPs Aufnahme von n8n bestätigt dieses Architekturmuster auf Enterprise-Ebene.
Zweitens: Lassen sich für jeden KI-Einsatz die fünf Annex-22-Anforderungen belegen? In der Beratungspraxis zeigt sich: Die Mehrheit der Unternehmen kann drei von fünf Punkten belastbar beantworten. Die Lücken liegen regelmäßig bei der Lifecycle-Validierung und der Traceability über Systemgrenzen hinweg.
Drittens: Welche Vendor-Abhängigkeiten entstehen — und welche sind bewusst gewählt? SAP hält derzeit 1,3 % an n8n. n8n bleibt unabhängig, Self-Hosting ist möglich. Gleichwohl: Was heute eine Partnerschaft ist, kann sich mittelfristig zu einer Vollintegration entwickeln. Jede Vendor-Abhängigkeit in einem validierten Prozess erhöht den Change-Control-Aufwand bei Lizenzänderungen.
Einordnung
In kritischen Anwendungen gehören ausschließlich deterministische, validierte Modelle. In nicht-kritischen Anwendungen kann KI assistieren — unter menschlicher Aufsicht und dokumentierter Verantwortung.
Das ist die Differenzierung, die Annex 22 einfordert. Und es ist die Differenzierung, die eine Systemarchitektur abbilden können muss — nicht als nachträgliche Governance-Schicht, sondern als strukturelle Grundlage. Die Werkzeuge werden besser. Die Frage ist, ob die Architekturen bereit sind, sie angemessen einzusetzen.