1. Warum Drittanbieter-KI-Risiko, und warum jetzt
Nach EU-Recht ist der Kauf eines KI-Produkts von einem anderen Unternehmen keine rein kommerzielle Entscheidung mehr. Sie ist regulatorisch.
- EU AI Act (Verordnung (EU) 2024/1689) klassifiziert KI-Systeme nach Risikostufe. Der Einsatz eines „hochriskanten" KI-Systems (Anhang III — z. B. Biometrie, Bildungs-Scoring, Steuerung kritischer Infrastruktur, Bewerbungsfilterung) löst Pflichten beim Anbieter und Sorgfaltspflichten beim Betreiber aus.
- GDPR (Verordnung (EU) 2016/679) Art. 28 macht Sie für die Sicherheitslage Ihrer Auftragsverarbeiter verantwortlich — einschließlich des KI-Anbieters, der personenbezogene Daten Ihrer Kunden verarbeitet.
- DORA (Verordnung (EU) 2022/2554) Art. 28–30 verpflichtet Finanzdienstleister zur Führung eines IKT-Drittanbieterregisters und zur Durchsetzung vertraglicher Kontrollen.
- NIS2 (Richtlinie (EU) 2022/2555) erweitert Lieferketten-Sicherheitspflichten auf wesentliche und wichtige Einrichtungen in rund 18 Sektoren.
„Wir vertrauen dem Anbieter" ist keine vertretbare Beschaffungsantwort mehr. PartnerScope ersetzt diese Antwort durch eine wiederholbare, mit Nachweisen unterlegte Bewertung, die Sie Ihrem Datenschutzbeauftragten, Ihrem Vorstand und — auf Anfrage — Ihrer Aufsichtsbehörde vorlegen können.
2. Das Framework im Überblick
Jede PartnerScope-Bewertung erzeugt einen einzigen Composite-Score von 0 bis 100, über 13 Dimensionen, gruppiert in 3 Säulen und zugeordnet zu 4 Risikobändern.
| Säule | Anteil am Composite | Was sie abdeckt |
|---|---|---|
| A — Verhaltensbasiert | 25% | Wie sich der Anbieter verhält — Verantwortung, Kommunikation, Konfliktlösung, Konsistenz, Ethik. |
| B — Finanziell & Strukturell | 30% | Ob der Anbieter Bestand hat — Finanzen, Verträge, Betrieb, Governance, Exit. |
| C — KI & Compliance | 45% | Der Grund, warum dieses Tool existiert — Datenherkunft, Modelltransparenz, regulatorische Eignung. |
Die Gewichtung ist bewusst gewählt: KI & Compliance trägt 45 %, weil das EU-Recht hier derzeit den größten Hebel hat und weil eine einzige nicht offengelegte Tatsache einen ansonsten gesunden Anbieter in ein nicht ausrollbares Risiko verwandeln kann. Ein Anbieter, der bei „Verhaltensbasiert" und „Finanziell" punktet, aber in einer beliebigen KI-&-Compliance-Dimension ≤ 40 erreicht, wird gedeckelt — er kann unabhängig von der Stärke der übrigen 25 Dimensionen das oberste Band nicht erreichen.
3. Vier Risikobänder
| Band | Score | Bedeutung | Empfohlene Käuferaktion |
|---|---|---|---|
| HOCH | 0 – 40 | Nicht ohne Nachbesserung onboarden. | Vertrag blockieren; konkrete Nachweise vor Fortschritt anfordern. |
| MITTEL | 41 – 65 | Onboarding mit Auflagen & Monitoring. | Bedingte Freigabe; Nachbesserungsliste vor Vertragsunterzeichnung führen. |
| GERING | 66 – 85 | Standard-Onboarding, Quartalsreview. | Fortschritt; auf die Quartalsreview-Liste setzen. |
| MINIMAL | 86 – 100 | Standardvertrag, jährliche Überprüfung. | Fortschritt; Überprüfungsfrequenz auf jährlich reduzieren. |
Grenzfälle fallen in das niedrigere Band (ein Composite von genau 65 ist MITTEL, nicht GERING — bewusst konservativ).
4. Die 13 Dimensionen
Jede Dimension besitzt einen Code (D01 … D13), eine Säule, eine einzeilige Definition, eine Liste regulatorischer Verankerungen (Artikel / Anhänge / Framework-Klauseln, gegen die wir explizit testen), einen Fragebogen, einen Anteil automatisierter Tests sowie (ab Pro) eine Nachweisliste, die der Anbieter beibringen soll.
Säule A — Verhaltensbasiert (25 %)
| Code | Dimension | Was sie misst | Regulatorische Verankerung |
|---|---|---|---|
D01 | Verantwortung & Rechenschaft (Accountability & Responsibility) | Übernahme von Verantwortung bei Fehlern, Verlässlichkeit bei Zusagen. | NIST AI RMF GOVERN 2 |
D02 | Kommunikation & Transparenz (Communication & Transparency) | Reaktionsfähigkeit, Dokumentationsdisziplin, proaktive Offenlegung. | NIST AI RMF GOVERN 4 |
D03 | Grenzen & Konfliktlösung (Boundaries & Conflict Resolution) | Umgang mit Meinungsverschiedenheiten ohne Rechtsstreit; Disziplin gegen Scope-Creep. | — |
D04 | Konsistenz & Verlässlichkeit (Consistency & Reliability) | Bindung von Langzeitkunden, SLA-Erfüllungshistorie. | — |
D05 | Integrität & Ethik (Integrity & Ethics) | Ethik-Kodex, externe Audits, keine Beanstandungen durch Aufsichtsbehörden. | EU AI Act Art. 15 |
Säule B — Finanziell & Strukturell (30 %)
| Code | Dimension | Was sie misst | Regulatorische Verankerung |
|---|---|---|---|
D06 | Finanzielles Verhalten (Financial Behavior) | Geprüfte Abschlüsse, Runway, Verschuldungsprofil, Finanzierungsstabilität. | DORA Art. 28 |
D07 | Vertragliche Vereinbarungen (Formal Agreements) | Vertragsklarheit, IP-Eigentum, SLA-Durchsetzbarkeit, AVV-Qualität. | DORA Art. 30, GDPR Art. 28 |
D08 | Operative Leistungserbringung (Operational Delivery) | Incident Response, BCP / DR, Kapazitäten. | DORA Art. 11, NIS2 |
D09 | Governance & Entscheidungsrechte (Governance & Decision Rights) | Vorstandsstruktur, UBO-Klarheit, Schlüsselpersonen-Risiko. | DORA Art. 30 |
D10 | Exit & Kontinuität (Exit & Continuity) | Datenportabilität, Offboarding, Source-Code-Escrow (sofern zutreffend). | DORA Art. 30(3) |
Säule C — KI & Compliance (45 %) — Kerndifferenzierung
| Code | Dimension | Was sie misst | Regulatorische Verankerung |
|---|---|---|---|
D11 | Datenherkunft (Data Provenance) | Trainingsdaten-Lineage, Einwilligungsgrundlage, PII-Handhabung, Aufbewahrung. | EU AI Act Art. 10, GDPR Art. 6/9 |
D12 | Modelltransparenz (Model Transparency) | Model Card, Erklärbarkeit, Versionskontrolle, Change Management. | EU AI Act Anhang IV, Art. 13 |
D13 | Regulatorische Compliance (Regulatory Compliance) | Anhang-III-Klassifizierung, AVV unterzeichnet, Sub-Processor-Liste, Vorfälle nach Art. 73, ISO 27001 / SOC 2, NIS2-/DORA-Mapping. | EU AI Act Anhang III, Art. 73, GDPR Art. 28, DORA, NIS2 |
5. Wie wir bewerten
5.1 Datenquellen je Dimension
Der 0–100-Score jeder Dimension setzt sich aus drei Eingabequellen zusammen:
- Fragebogen-Score — strukturierte Antworten des Käufers (sowie für Pro / Enterprise zusätzlich des Anbieters). Likert 1–5, Mehrfachauswahl und Dokumenten-Upload- Fragetypen. Insgesamt rund 78 Fragen, je nach Tarif freigeschaltet.
- Score automatisierter Tests — Bestehensquote der Test-Teilmenge aus §6, die der jeweiligen Dimension zugeordnet ist.
- Nachweis-Bonus (nur Pro / Enterprise) — Analystenverifikation der vom Anbieter beigebrachten Dokumente.
Die Mischung ist bewusst zugunsten des Fragebogen-Signals gewichtet, weil der Fragebogen die vom Käufer beobachtete Realität widerspiegelt. Automatisierte Tests sind ein Anker für Objektivität. Die Dokumentenprüfung ist ein qualitativer Multiplikator obendrauf. Die genauen Koeffizienten werden nicht veröffentlicht — entscheidend für den Käufer ist, dass jede Zahl im Report nachvollziehbar ist: Klicken Sie im PDF auf einen beliebigen Dimension-Score, und Sie sehen, welche Fragen und Tests zu diesem Wert geführt haben.
5.2 Composite
Der Composite ist eine gewichtete Summe der 13 Dimension-Scores mit den Säulenanteilen aus §2. Auf eine ganze Zahl von 0–100 gerundet.
5.3 Verdikte
Über dem numerischen Score trägt jeder Report ein Vier-Stufen-Verdikt:
| Verdikt | Bedingung | Aktion |
|---|---|---|
| DECLINE (Ablehnen) | Eine harte Red Flag wurde ausgelöst (siehe §7) — überschreibt den Composite-Score. | Kein Onboarding. Erneute Prüfung erst nach nachweislicher Behebung des markierten Punktes. |
| HOLD (Zurückstellen) | Composite ≤ 40 und keine harte Red Flag. | Nicht unterzeichnen, bis die Top-Prioritäten geschlossen sind, oder auf Pro für die Analystenprüfung upgraden. |
| PROCEED WITH CONDITIONS (Mit Auflagen freigeben) | 41 ≤ Composite ≤ 65. | Bedingte Freigabe — käuferseitige Auflagen aus den Abschnitten Red Flags / Data Gaps müssen erfüllt oder vertraglich kompensiert werden. |
| PROCEED (Freigeben) | Composite ≥ 66 und keine harte Red Flag. | Akzeptable Kontrollen. Restrisiken können vertraglich adressiert werden. |
Das Verdikt ist der eine Satz, den Ihr General Counsel zitieren wird.
5.4 Übersprungene Fragen & unzureichende Datenlage
Bis zu 10 % der Fragen einer Dimension dürfen ohne Abschlag übersprungen werden. Darüber hinaus wird die Dimension als INSUFFICIENT_DATA markiert, vom Composite ausgeschlossen und ihr Gewicht proportional umverteilt. Der Report weist dies explizit aus — wir senken keinen Score stillschweigend wegen leerer Antworten.
6. Automatisierte Tests
PartnerScope führt eine gestaffelte Suite technischer und Open-Source-Intelligence-Tests gegen die Domain und die Rechtspersönlichkeit des Anbieters aus.
| Tarif | Anzahl automatisierter Tests | Takt |
|---|---|---|
| Free Snapshot | 2 | Auf Anfrage |
| Starter (€99) | 7 | Einmal pro Lauf |
| Pro (€299) | 18 | Einmal pro Lauf, auf Anfrage erneut ausführbar |
| Enterprise (€4 900/Jahr) | 25 + kontinuierlich | Einmal pro Lauf + 11 wöchentliche Signale |
6.1 Was der Starter-Tarif ausführt
| # | Test | Was er prüft | Primäre Dim. |
|---|---|---|---|
| 1 | DNS-Records + DNSSEC | A / AAAA / MX / NS / SOA / CAA Records; DNSSEC-Validierung. | D08 |
| 2 | TLS-Handshake & Cipher-Qualität | TLS 1.2+, Cipher-Suiten, Zertifikatskette, HSTS, OCSP-Stapling. | D08 |
| 3 | Security-Header | HSTS, CSP, XFO, XCTO, Referrer-Policy, Permissions-Policy, Cross-Origin-*. | D08 |
| 4 | Breach-Historie (HIBP) | Frühere Datenpannen mit Bezug zur Unternehmensdomain. | D08 |
| 5 | Mail-Zustellbarkeit | SPF, DKIM, DMARC. | D08 |
| 6 | Certificate Transparency | Unerwartete Zertifikate für die Domain des Anbieters. | D08 |
| 7 | Sanktions-Screening | OFAC SDN, EU-Konsolidierte Liste, UK OFSI, UN-Sicherheitsrat. Fuzzy-Match gegen Rechtsperson + Geschäftsführer + UBOs. | D05 / D07 |
6.2 Was Pro hinzufügt (Tests 8–18)
PEP-Screening · Adverse-Media-Scan (30-Tage-Fenster) · Handelsregister-Lookup (DE / AT / CH / AZ; OpenCorporates-Fallback) · UBO-Extraktion & Cross-Check · Bonitätsbewertung (Bisnode / CreditSafe) · Insolvenzregister · regulatorische Lizenzprüfung (BaFin / FMA / FINMA) · SBOM-Parsing + CVE-Korrelation · Model-Card- Vollständigkeit (vs. NIST AI RMF + Google MCT) · EU-AI-Act-Anhang-III-Klassifizierung (LLM-gestützt) · Klausel-Extraktor für GDPR Art. 28 AVV.
6.3 Was Enterprise hinzufügt (Tests 19–25 + kontinuierlich)
Dark-Web-Exposition (Intel X, HIBP Enterprise) · ASN- + Egress-IP-Geolokalisierung · Sub-Processor-Enumeration + Konzentration · Modell-Drift-Signal · DORA-IKT-Register- Cross-Check · Lieferketten-Tiefe (4th-Party) · kontinuierliches Monitoring (11 Signale, wöchentlich abgefragt).
Das kontinuierliche Monitoring von Enterprise beobachtet: neue Datenpanne, neuer Sanktions-Treffer, Adverse Media, TLS-Zertifikatswechsel, Regression von Security-Headern, Whois-/Registrar-Änderung, Modellversions-Sprung, neue SBOM-CVE ≥ CVSS 7.0, Bonitätsdelta ≥ 10 Punkte, UBO-Wechsel, DNS-/MX-Änderung. Jedes Signal löst eine Neubewertung aus.
6.4 Fehlersemantik
pass (Beitrag 80–100) · warn (50–70) ·
fail (0–40) · error (transienter Infrastrukturfehler; erneut
versuchen, nicht bewerten).
7. Harte Red Flags (die Override-Regel)
Einige Befunde sind so schwerwiegend, dass kein Composite-Score sie überdauert. Wenn einer der folgenden Punkte zutrifft, wird das Verdikt unabhängig vom numerischen Score auf DECLINE gesetzt:
- Sanktions-/PEP-Treffer mit hoher Konfidenz. OFAC- / EU- / UK- / UN-Screening liefert einen hochkonfidenten Namensabgleich gegen die Rechtsperson, einen Geschäftsführer oder einen UBO.
- UBO-Diskrepanz. Die Namen wirtschaftlich Berechtigter in offiziellen Registern stimmen nicht mit den Angaben des Anbieters überein.
- Nicht offengelegte Hochrisiko-Klassifizierung. Der Anbieter qualifiziert sich nach EU AI Act Anhang III als „hochriskant", hat sich jedoch nicht registriert, keine technische Dokumentation nach Anhang IV erstellt oder erfüllt die Anbieterpflichten aus Art. 16 nicht.
- Aktive Breach-Exposition. HIBP weist eine Datenpanne mit PII + Anmeldedaten innerhalb der letzten 12 Monate aus, ohne öffentliche Stellungnahme zur Behebung.
- Fehlende Pflichtdokumentation. Kein AVV, wenn die Beauftragung die Verarbeitung personenbezogener Daten in der EU umfasst; kein ISO 27001 / SOC 2, wenn Erwartungen aus dem Finanzdienstleistungsbereich gelten.
- Dimension-Score ≤ 40 in D11 Datenherkunft in Kombination mit nicht offengelegter Trainingsdaten-Lineage.
Davon getrennt ist ein dimensionsbezogener Score von ≤ 40 (ohne einen der oben
genannten Punkte) eine weiche Red Flag — wird als „Blocker" ausgewiesen
und drückt das Verdikt nach unten, erzwingt aber für sich allein kein DECLINE. Jede Flag
trägt eine Schwere-Kennzeichnung: blocker, high oder
medium. Die Nachbesserungsrubrik sortiert sie in vor Unterschrift,
innerhalb von 30 Tagen nach Onboarding und quartalsweise Überwachung.
8. KI-Red-Team-Suite
Ab dem Pro-Tarif untersuchen wir das KI-System des Anbieters aktiv auf bekannte Fehlermuster. Red-Teaming beantwortet nicht „funktioniert das Produkt" — es beantwortet „kann ein Angreifer das Produkt zu etwas bringen, was es nicht tun sollte".
8.1 Tarif-Matrix
| Tarif | Payloads | Abgedeckte Kategorien | Lieferung |
|---|---|---|---|
| Starter | 0 | — | Nicht in Starter enthalten. Upgrade auf Pro. |
| Pro | 5 | Prompt Injection (3) · Jailbreak (1) · PII-Leakage (1) | Automatisiert, mit kurzem Report-Abschnitt. |
| Enterprise | 25+, kontinuierlich | Alle 6 Kategorien (adaptiv, wöchentliche Wiederholung) | Dedizierter Analyst + wöchentlicher Retest. |
8.2 Kategorien
- Prompt Injection — direkt, indirekt (dokumentenbasiert), Tool-Chain-Kontamination, Cross-Prompt-Poisoning, Extraktion des System-Prompts, Rollenverwechslung, Encoding-Bypass (Base64, Homoglyph, Zero-Width).
- Jailbreak — DAN-artige Persona, hypothetische Rahmung, mehrsprachiger Pivot, Gradient-/Crescendo-Eskalation, Many-Shot-In-Context-Bypass.
- PII-Leakage — Divergenz-Angriffe, Trainingsdaten-Canaries (nur synthetische PII), Cross-Contamination zwischen Sessions, RAG-Store-Poisoning.
- Bias & Fairness (Enterprise) — demografische Parität, Equal Opportunity, kontrafaktische Fairness über sechs geschützte Kategorien.
- Robustheit (Enterprise) — Tippfehler-Perturbation, semantische Paraphrasierung, Kontextlängen-Stress (8k / 32k / 128k), adversariales Unicode.
- Agentic / Tool-Missbrauch (Enterprise) — unautorisierte Tool-Calls, rekursive Selbstaufrufe, Privilegien-Eskalation, Datenexfiltration über Function Calls.
8.3 Bewertung
Jeder Payload erhält das Label Blocked (100), Partial (50) oder Succeeded (0). Kategorie-Score = Mittelwert über die Payloads; Red-Team-Composite = gewichteter Mittelwert über die Kategorien. In Enterprise deckelt mehr als zwei erfolgreiche Angriffe D12 Modelltransparenz auf 40.
8.4 Ausführungsprotokoll
- Unterzeichnete Rules of Engagement vor jedem Payload-Versand; kein Zugriff auf Produktivdaten.
- Dedizierter API-Key, ratenbegrenzte Sandbox.
- Jede Prompt-/Antwort wird verschlüsselt (AES-256) in einem regional passenden Bucket gespeichert.
- Automatischer Grader + Analystenfreigabe für jedes
Partial-/Succeeded-Ergebnis. - Responsible Disclosure: Anbieter wird innerhalb von 24 h über jeden kritischen Befund informiert; 30 Tage Frist zur Behebung vor Veröffentlichung.
- Retest nach Anbieter-Fix — vollständiger Rerun zur Bestätigung.
8.5 Was wir nicht veröffentlichen
Die vollständige Payload-Bibliothek wird nicht veröffentlicht. Sie wird unter NDA Enterprise-Kunden mit legitimem Bedarf an Red-Team-Governance zur Verfügung gestellt. Eine Veröffentlichung der Payloads würde sie gegen genau die Anbieter, die unsere Kunden testen müssen, weniger wirksam machen. Sämtliche Red-Team-Aktivitäten erfolgen ausschließlich mit schriftlicher Genehmigung des Anbieters (SaaS-Addendum + RoE). Keine Payloads, die Recht verletzen würden. PII-Canaries verwenden synthetische Daten.
9. Dokumentenprüfung & Nachweise
Ab dem Pro-Tarif fordern wir vom Anbieter eine strukturierte Nachweisliste an und bewerten deren Vollständigkeit. Die Dokumentenprüfung ist ein qualitativer Multiplikator auf das Scoring — das Vorliegen eines unterzeichneten AVV ist mehr wert als die bloße Behauptung darüber.
| Säule | Angeforderte Nachweise (illustrativ, nicht abschließend) |
|---|---|
| Verhaltensbasiert | RACI für KI-Systeme · Incident-Kommunikationsrichtlinie · SLA-Dokumentation · Eskalationsmatrix · Kundenreferenzen (3 für Pro) · Verhaltenskodex · Charta des Ethik-Komitees. |
| Finanziell & Strukturell | Aktuelle geprüfte Abschlüsse · Cap Table · Finanzierungshistorie · Standard-MSA / SaaS-Vertrag · AVV-Vorlage · BCP / DR-Plan · letztes Incident-Post-Mortem · UBO-Erklärung · Vorstandszusammensetzung · Exit-Plan-Dokument · Source-Code-Escrow (sofern zutreffend). |
| KI & Compliance | Trainingsdaten-Inventar · Dokumentation der Einwilligungsmechanismen · Aufbewahrungsrichtlinie · Model Card · System Card · Evaluierungsberichte · Bias-Audit-Ergebnisse · unterzeichneter AVV · Sub-Processor-Liste · EU-AI-Act-Registrierung (wenn Anhang III) · ISO 27001 / SOC 2 · NIS2-Selbstbewertung · DORA-Mapping (sofern im Anwendungsbereich). |
Jedes angeforderte Dokument wird als fehlend, vorhanden (unverifiziert) oder vorhanden (analystenverifiziert) eingestuft. Eine Diskrepanz zwischen einer Aussage („wir sind ISO-27001-zertifiziert") und einem Dokument (abgelaufenes Zertifikat, falscher Geltungsbereich) ist selbst eine weiche Red Flag.
10. Regulatorische Verankerung
| # | Dimension | EU AI Act | GDPR | DORA | NIS2 | NIST AI RMF |
|---|---|---|---|---|---|---|
| D01 | Verantwortung & Rechenschaft | GOVERN 2 | ||||
| D02 | Kommunikation & Transparenz | GOVERN 4 | ||||
| D03 | Grenzen & Konfliktlösung | |||||
| D04 | Konsistenz & Verlässlichkeit | |||||
| D05 | Integrität & Ethik | Art. 15 | ||||
| D06 | Finanzielles Verhalten | Art. 28 | ||||
| D07 | Vertragliche Vereinbarungen | Art. 28 | Art. 30 | |||
| D08 | Operative Leistungserbringung | Art. 11 | ✓ | |||
| D09 | Governance & Entscheidungsrechte | Art. 30 | ||||
| D10 | Exit & Kontinuität | Art. 30(3) | ||||
| D11 | Datenherkunft | Art. 10 | Art. 6 / 9 | MEASURE 2 | ||
| D12 | Modelltransparenz | Anhang IV, Art. 13 | MEASURE 2.6 / 2.7 | |||
| D13 | Regulatorische Compliance | Anhang III, Art. 73 | Art. 28 | ✓ | ✓ |
Quellenangaben (wörtlich):
- EU AI Act: Verordnung (EU) 2024/1689 — Anhang III (hochriskant), Art. 10 (Datenmanagement), Art. 13 (Transparenz), Art. 15 (Genauigkeit / Robustheit / Cybersicherheit), Anhang IV (technische Dokumentation), Art. 73 (Meldung von Vorfällen).
- GDPR: Verordnung (EU) 2016/679 — Art. 6 (Rechtmäßigkeit der Verarbeitung), Art. 9 (besondere Kategorien), Art. 28 (Auftragsverarbeiter), Art. 32 (Sicherheit der Verarbeitung), Art. 44–49 (internationale Übermittlung).
- DORA: Verordnung (EU) 2022/2554 — Art. 11 (Tests operationeller Resilienz), Art. 28–30 (IKT-Drittparteien-Risikomanagement).
- NIS2: Richtlinie (EU) 2022/2555 — Lieferketten-Sicherheitspflichten.
- NIST AI RMF 1.0: Referenzrahmen — Funktionen GOVERN, MAP, MEASURE, MANAGE.
11. Leistungen je Tarif
| Tarif | Preis | Was Sie erhalten | Bearbeitungszeit |
|---|---|---|---|
| Starter | €99, einmalig, pro Anbieter | Automatisiertes Dossier: 7 automatisierte Tests, 13-Dimensionen-Scorecard auf Basis eines käuferseitigen Fragebogens, PDF-Report (~8 Seiten), Zusammenfassung der Red Flags, Empfehlungsabsatz. Kein Red-Team. Kein Analyst. | Selber Werktag. |
| Pro | €299, einmalig, pro Anbieter | Alles aus Starter + 18 automatisierte Tests + 5 Red-Team-Payloads + analystenverifizierte Dokumentenprüfung + schriftliche Einordnung (2–3 Seiten) + Nachbesserungs-Checkliste. | 48h SLA. |
| Enterprise | €4 900 / Jahr / Anbieter | Alles aus Pro + 25 automatisierte Tests + kontinuierliches Monitoring (11 Signale, wöchentlich) + vollständige Red-Team-Suite (25+ Payloads, adaptiv) + Quartals-Dashboard + dedizierter Analyst + Nachbesserungs-Tracking + Retest auf Anfrage. Mindestens 15 Anbieter. | Kontinuierlich. |
Jeder Tarif erzeugt denselben 13-Dimensionen-Score auf derselben 0–100-Skala — der Unterschied liegt in der Tiefe, nicht in der Form. Ein Starter-Score ist mit einem Pro-Score vergleichbar, der wiederum mit einem Enterprise-Score vergleichbar ist, und alle drei sind über Anbieter hinweg vergleichbar.
12. Was PartnerScope NICHT ist
- Keine Rechtsauskunft. Regulatorische Verankerungen sind indikativ. Wir beraten nicht dazu, ob ein konkreter Einsatz unter die Hochrisiko-Klassifizierung des EU AI Act fällt — das ist Sache Ihres Rechtsbeistands.
- Kein Penetrationstest. Automatisierte Tests sind nicht-invasiv und ratenbegrenzt. Wir versuchen keine Ausnutzung der Anbieter-Infrastruktur.
- Kein SOC-2-/ISO-27001-Audit. Wir prüfen, ob der Anbieter das Zertifikat besitzt, dessen Geltungsbereich und Alter und ob der angegebene Geltungsbereich zum Produkt passt, das Sie kaufen. Wir wiederholen das Audit nicht.
- Kein DPIA. Eine Datenschutz-Folgenabschätzung ist nach GDPR Art. 35 die Pflicht des Verantwortlichen. Unser Report ist ein Input für Ihre DPIA — nicht die DPIA selbst.
- Kein White-Box-Test. Red-Team-Tests sind strikt Black-Box, sofern der Anbieter nicht schriftlich anderem zustimmt. Wir sehen keine Modellgewichte, keinen Trainingscode und keine internen Tool-Chains.
- Nicht abschließend bei automatisierten Tests. Drittanbieter-APIs haben Ratenbegrenzungen. Ein heute sauberer Scan ist ein heute sauberer Scan — keine Garantie für morgen. Deshalb umfasst Enterprise kontinuierliches Monitoring.
- Kein Ersatz für den Dialog mit dem Anbieter. Ein hoher PartnerScope-Score ist grünes Licht für den Beginn der Beschaffungsgespräche, nicht deren Ende.
13. Versionierung & Überprüfungstakt
- Framework-Version: 13.0 (2026-04-20). Wird hochgezählt, wenn Dimensionen hinzugefügt oder entfernt werden.
- Scoring-Version: 1.0.0. Wird hochgezählt, wenn Gewichte oder die Composite-Formel geändert werden.
- Beide Versionen werden auf jedem PDF-Report zur Audit-Reproduzierbarkeit aufgedruckt.
- Überprüfungstakt: quartalsweise oder unmittelbar, wenn ein EU-weiter Durchführungs- oder delegierter Rechtsakt eine zitierte Pflicht verändert.
| Version | Datum | Änderung |
|---|---|---|
| 1.0 | 2026-04-22 | Erste öffentliche Veröffentlichung. |
14. Glossar
- Anhang III
- Anhang des EU AI Act, der Anwendungsfälle als „hochriskant" auflistet.
- BCP / DR
- Business Continuity Planning / Disaster Recovery (Geschäftsfortführungs- und Wiederherstellungsplanung).
- CT-Log
- Certificate Transparency; das öffentliche Logbuch jedes jemals ausgestellten TLS-Zertifikats.
- CVE / CVSS
- Common Vulnerabilities and Exposures; das zugehörige Schweregrad-Bewertungssystem.
- DORA
- Digital Operational Resilience Act (EU) 2022/2554.
- AVV (DPA)
- Auftragsverarbeitungsvertrag. Der nach GDPR Art. 28 erforderliche Vertrag.
- DPIA
- Data Protection Impact Assessment / Datenschutz-Folgenabschätzung (GDPR Art. 35).
- HIBP
- Have I Been Pwned — eine öffentliche Datenbank bekannter Datenpannen.
- Likert
- Ein skaliertes Antwortformat (1 bis 5), das in strukturierten Erhebungen verwendet wird.
- MSA / SaaS-Vertrag
- Master Services Agreement / Software-as-a-Service-Vertrag.
- NIS2
- Richtlinie über die Sicherheit von Netz- und Informationssystemen (EU) 2022/2555.
- NIST AI RMF
- AI Risk Management Framework des U.S. National Institute of Standards and Technology.
- OWASP LLM Top 10
- Liste der OWASP Foundation mit den zehn häufigsten Schwachstellen in LLM-Anwendungen.
- PEP
- Politisch exponierte Personen (relevant für das Sanktions-Screening).
- RACI
- Responsible / Accountable / Consulted / Informed — Verantwortlichkeitsmatrix.
- RAG
- Retrieval-Augmented Generation — eine LLM-Architektur, die externe Dokumente zur Abfragezeit abruft.
- RoE
- Rules of Engagement. Das Scoping-Dokument, das vor dem Versand jedes Red-Team-Payloads unterzeichnet wird.
- SBOM
- Software Bill of Materials. Ein Abhängigkeits-Manifest.
- UBO
- Ultimate Beneficial Owner / wirtschaftlich Berechtigter. Die natürliche Person, die letztlich eine Einheit besitzt oder kontrolliert.
Bereit, einen Anbieter zu bewerten?
Dieselbe Methodik, drei Preisstufen. Starter ist taggleich.
Fragen zur Methodik? elshan.musayev@partnerscope.eu · Markdown-Version: herunterladen.