SAP investiert in n8n — was das für regulierte Prozesse in der Pharmabranche bedeutet

Seit Juli 2025 existiert Annex 22 — das erste dedizierte GMP-Regelwerk für künstliche Intelligenz in der Pharmaproduktion. Am 12. Mai kündigte SAP auf der Sapphire-Konferenz in Orlando eine strategische Beteiligung an n8n an — einem Berliner Workflow-Plattform-Unternehmen, dessen Lösung ab Q3 2026 nativ in SAP's Joule Studio integriert wird. Für die Pharmabranche markiert dies eine Architekturentscheidung mit direktem Einfluss auf die praktische Umsetzung von Annex 22.

Was Annex 22 von der Industrie verlangt

Die EMA hat mit Annex 22 zum EU-GMP-Leitfaden erstmals ein Rahmenwerk geschaffen, das sich ausschließlich mit KI und Machine Learning in der Arzneimittelherstellung befasst. Die zentrale Unterscheidung erfolgt zwischen kritischen und nicht-kritischen GMP-Anwendungen:

Modelltyp-Beschränkung: In kritischen GMP-Anwendungen sind ausschließlich statische, deterministische Modelle zulässig. Probabilistische Modelle, dynamisch lernende Systeme, Generative AI und LLMs sind ausdrücklich ausgeschlossen.
Intended Use: Jedes KI-System erfordert dokumentierte Zweckbestimmung — Funktionsumfang, Daten, Einsatzbedingungen — vor produktivem Einsatz.
Validierung über den Lebenszyklus: Kontinuierliches Performance-Monitoring ist erforderlich. Ändern sich Daten oder Modellparameter, muss die Validierung nachgeführt werden.
Human-in-the-Loop: Für ausreichend getestete, deterministische Modelle in kritischen Anwendungen ist HITL nicht zwingend. Eine explizite HITL-Pflicht gilt für den Einsatz von Generativer KI in nicht-kritischen Anwendungen.
Explainability und Traceability: Modelle müssen nachvollziehbar sein. Vollständige Rückverfolgbarkeit über Eingabedaten, Modellversion, Ergebnis und Freigabe ist durchgängig sicherzustellen.

Warum die SAP-Beteiligung regulatorisch relevant ist

n8n verbindet deterministische Automation mit agentischen KI-Fähigkeiten. Jan Oberhauser, Gründer und CEO, beschreibt den Ansatz: „Manche Arbeit ist deterministisch — ein richtiger Ausgang, alles andere ist Fehler. Der Rest ist nicht-deterministisch."

Diese Unterscheidung spiegelt exakt die Grenze wider, die Annex 22 zieht. Drei Anwendungsfälle illustrieren dies:

Chargenfreigabe — kritische GMP-Anwendung. Ausschließlich statische, deterministische Modelle. KI-Agenten und LLMs sind kategorisch ausgeschlossen. Der Prozess transportiert Daten deterministisch, eine autorisierte Person signiert.
Abweichungsanalyse — als nicht-kritische Anwendung dürfen LLM-gestützte Werkzeuge einen Berichtsentwurf erstellen — unter striktem HITL. Die finale Verantwortung verbleibt beim Qualitätsverantwortlichen.
Validierungsdokumentation — nicht-kritisch, sofern der Entwurf keinen direkten Einfluss auf Freigabeentscheidungen hat. Ein maschinell erstellter Entwurf unter HITL ist vertretbar. Eine automatisch freigegebene FS ist es nicht.

Drei Fragen für IT, QA und Fachbereich

Erstens: Wo endet der validierte Prozess — und wo beginnt die technische Integration? Fachlogik gehört in eine orchestrierende Schicht mit eigenem Audit-Trail. Technische Datentransporte gehören in eine gekapselte Integrations-Schicht. SAPs Aufnahme von n8n bestätigt dieses Architekturmuster auf Enterprise-Ebene.

Zweitens: Lassen sich für jeden KI-Einsatz die fünf Annex-22-Anforderungen belegen? In der Beratungspraxis zeigt sich: Die Mehrheit der Unternehmen kann drei von fünf Punkten belastbar beantworten. Die Lücken liegen regelmäßig bei der Lifecycle-Validierung und der Traceability über Systemgrenzen hinweg.

Drittens: Welche Vendor-Abhängigkeiten entstehen — und welche sind bewusst gewählt? SAP hält derzeit 1,3 % an n8n. n8n bleibt unabhängig, Self-Hosting ist möglich. Gleichwohl: Was heute eine Partnerschaft ist, kann sich mittelfristig zu einer Vollintegration entwickeln. Jede Vendor-Abhängigkeit in einem validierten Prozess erhöht den Change-Control-Aufwand bei Lizenzänderungen.

Einordnung

In kritischen Anwendungen gehören ausschließlich deterministische, validierte Modelle. In nicht-kritischen Anwendungen kann KI assistieren — unter menschlicher Aufsicht und dokumentierter Verantwortung.

Das ist die Differenzierung, die Annex 22 einfordert. Und es ist die Differenzierung, die eine Systemarchitektur abbilden können muss — nicht als nachträgliche Governance-Schicht, sondern als strukturelle Grundlage. Die Werkzeuge werden besser. Die Frage ist, ob die Architekturen bereit sind, sie angemessen einzusetzen.

Since July 2025, Annex 22 has existed — the first dedicated GMP framework for artificial intelligence in pharmaceutical manufacturing. On May 12, SAP announced a strategic stake in n8n at the Sapphire conference in Orlando — a Berlin-based workflow platform whose solution will be natively integrated into SAP's Joule Studio from Q3 2026. For the pharmaceutical industry, this marks an architectural decision with direct implications for the practical implementation of Annex 22.

What Annex 22 demands from industry

With Annex 22 to the EU GMP Guide, the EMA has created the first framework addressing AI and machine learning in drug manufacturing exclusively. The key distinction is drawn between critical and non-critical GMP applications:

Model type restriction: In critical GMP applications, only static, deterministic models are permitted. Probabilistic models, dynamically learning systems, generative AI, and LLMs are explicitly excluded.
Intended use: Every AI system requires documented purpose definition — scope, data, operating conditions — before going live.
Lifecycle validation: Continuous performance monitoring is required. If data or model parameters change, validation must be updated accordingly.
Human-in-the-loop: For adequately tested, deterministic models in critical applications, HITL is not mandatory. An explicit HITL requirement applies to the use of generative AI in non-critical applications.
Explainability and traceability: Models must be interpretable. Full traceability across input data, model version, output, and release decision must be maintained end-to-end.

Why SAP's investment is regulatorily relevant

n8n combines deterministic automation with agentic AI capabilities. Jan Oberhauser, founder and CEO, describes the approach: "Some work is deterministic — one right outcome, everything else is an error. The rest is non-deterministic."

This distinction maps precisely onto the boundary Annex 22 draws. Three use cases illustrate this:

Batch release — a critical GMP application. Only static, deterministic models are permitted. AI agents and LLMs are categorically excluded. The process transports data deterministically; an authorized person signs off.
Deviation analysis — as a non-critical application, LLM-assisted tools may produce a draft report — under strict HITL. Final responsibility remains with the quality responsible person.
Validation documentation — non-critical, provided the draft has no direct influence on release decisions. A machine-generated draft functional spec under HITL is defensible. An automatically approved FS is not.

Three questions for IT, QA, and the business

First: Where does the validated process end — and where does technical integration begin? Business logic belongs in an orchestration layer with its own audit trail. Technical data transport belongs in an encapsulated integration layer. SAP's adoption of n8n confirms this architecture pattern at the enterprise level.

Second: Can you demonstrate the five Annex 22 requirements for every AI deployment? In consulting practice, the majority of companies can answer three of the five points substantively. Gaps consistently appear in lifecycle validation and cross-system traceability.

Third: What vendor dependencies are created — and which are deliberate choices? SAP currently holds 1.3% of n8n. n8n remains independent; self-hosting is possible. That said, what is a partnership today may evolve into full integration over the medium term.

The bottom line

In critical applications: only deterministic, validated models. In non-critical applications: AI may assist — under human oversight and documented accountability.

That is the distinction Annex 22 demands. And it is the distinction that a system architecture must be able to reflect — not as a retrofit governance layer, but as structural foundation. The tools are improving. The question is whether the architectures are ready to deploy them appropriately.