Files
Benjamin Admin b175212516
CI / detect-changes (push) Successful in 5m10s
CI / nodejs-build (push) Successful in 2m15s
CI / branch-name (push) Has been skipped
CI / guardrail-integrity (push) Has been skipped
CI / secret-scan (push) Has been skipped
CI / dep-audit (push) Has been skipped
CI / sbom-scan (push) Has been skipped
CI / validate-canonical-controls (push) Successful in 5m1s
CI / loc-budget (push) Successful in 17s
CI / go-lint (push) Has been skipped
CI / python-lint (push) Has been skipped
CI / nodejs-lint (push) Has been skipped
CI / test-go (push) Failing after 46s
CI / test-python-backend (push) Has been skipped
CI / test-python-document-crawler (push) Has been skipped
CI / test-python-dsms-gateway (push) Has been skipped
docs(gt): update Spiegel GT with verified 2026-05-14 results
DSI: 9/9 L1 (was 6/9), 13698 words (was 6461), all FNs resolved.
Social Media: 10/10 L1 (was 9/10). Services: 31 detected (was 5).
Impressum: 9/13 (USt-IdNr + V.i.S.d.P. fixed).
Widerruf: NOT correctly tested (wrong text assigned, needs Cross-Doc Intelligence).

Full service list (31 providers) documented with country + EU status.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-05-14 23:07:42 +02:00

7.2 KiB

Ground Truth: Spiegel

URL: https://www.spiegel.de Typ: Medien / Nachrichtenportal Datum: 2026-05-14 (verifiziert gegen Live-Texte + System-Ergebnis) Volltext: 06-spiegel-dsi-fulltext.txt (13.698 Woerter, 107.720 Zeichen)


Business Profile (erwartet vs tatsaechlich)

Feld Erwartet System-Ergebnis
business_type b2c B2C
industry media media
has_online_shop true true
has_editorial_content true true
is_regulated_profession false false ✓ (gefixt, war FP "anwalt")
needs_odr true true
detected_services 31 10 angezeigt (31 intern) UI zeigt nur Top 10

Dokumente

Dokumenttyp Vorhanden URL System-Ergebnis
DSI Ja https://www.spiegel.de/datenschutz-spiegel 9/9 L1 (100%)
Impressum Ja https://www.spiegel.de/impressum 9/13 L1 (86%)
Social Media In DSI (Abschnitt 8) auto-filled 10/10 L1 (100%)
Cookie-RL In DSI (Abschnitt 4) auto-filled 1/6 L1 (17%)
AGB Ja https://www.spiegel.de/agb Nicht eingegeben
Nutzungsbedingungen Ja https://www.spiegel.de/nutzungsbedingungen 5/12 L1 (42%)
Widerruf In AGB §10 Falsch zugewiesen (NB-Text) 0/8 L1 (0%)
DSB-Kontakt In DSI auto-filled 9/9 L1 (100%)

DSI (Art. 13 DSGVO) — 9/9 L1, 24/42 L2

L1 Checks (9/9 PASS)

Check Erwartet System Beleg
Verantwortlicher PASS PASS (3/3) Ericusspitze 1, 20459 Hamburg
DSB PASS PASS (1/1) "z. Hd. der Datenschutzbeauftragten... dsb@spiegelgruppe.de"
Zwecke PASS PASS (1/1) Adobe-Tracking, Vertragsbeziehungen etc.
Rechtsgrundlage PASS PASS (3/4) Art. 6(1)(a), (b), (f)
Empfaenger PASS PASS (2/2) AVV erwaehnt
Drittlandtransfer PASS PASS (1/1) SCC erwaehnt
Speicherdauer PASS PASS (2/2) "30 Tage", Loeschfristen
Betroffenenrechte PASS PASS (6/7) Art. 15-18, 20, 21. Art. 22 fehlt (TP)
Beschwerderecht PASS PASS (1/1) HmbBfDI, Art. 77

L2 True Positives (korrekte Findings)

Check Status Begruendung
Interessenabwaegung FAIL (TP) Interesse benannt, keine Abwaegung dokumentiert
Art. 22 Profiling FAIL (TP) Nicht erwaehnt trotz personalisierter Werbung

Impressum — 9/13 L1, 9/31 L2

Check Erwartet System
Firmenname PASS PASS
Anschrift PASS PASS (2/2)
Kontakt PASS PASS (2/2)
Register PASS PASS (2/2)
USt-IdNr PASS PASS (1/1) ✓ Gefixt ("Umsatzsteuer-ID:" + DE mit Leerzeichen)
Vertretung PASS PASS (1/1)
V.i.S.d.P. PASS PASS ✓ Gefixt ("Verantwortlicher i.S.v. §18 MStV")
Streitbeilegung PASS PASS
Berufsrecht SKIP PASS (1/3) FP — "Berufsrechtliche Regelungen" matcht falsch

Social Media — 10/10 L1, 12/30 L2

Check Erwartet System
Gemeinsam Verantwortliche PASS PASS
Meta benannt PASS PASS ✓ "Meta Platforms Inc" erkannt
Vereinbarung Art. 26 PASS PASS (1/2) ✓ Seiteninsights erwaehnt
Anlaufstelle PASS PASS (1/1)
Plattformen PASS PASS (1/1)
Drittlandtransfer PASS PASS (2/2) ✓ SCC + DPF
Rechtsgrundlage PASS PASS (1/1)
Betroffenenrechte PASS PASS (1/1) ✓ Opt-Out erwaehnt
Social Bookmarks PASS PASS

L2 True Positives

Check Status Begruendung
Page Controller Addendum FAIL (TP) Nicht verlinkt
2-Klick-Loesung FAIL (TP) Nicht dokumentiert

Cookie-Infos stehen bei Spiegel im Sourcepoint-Banner und in DSI Abschnitt 4, nicht als eigenes Dokument. Section-Splitter hat einen kurzen Cookie-Abschnitt extrahiert, aber die meisten Checks scheitern weil die Details im Banner stehen (nicht im Text).


Nutzungsbedingungen — 5/12 L1

Aus spiegel.de/nutzungsbedingungen extrahiert (1679 Woerter). Echte Luecken bei Einbeziehungsklausel, ODR-Link, Kuendigung, Zahlungsarten.


Widerrufsbelehrung — 0/8 L1

Problem: System prueft Nutzungsbedingungen-Text (1679w) statt AGB-Text. Tatsaechlich: Widerrufsbelehrung steht in AGB §10 (spiegel.de/agb):

  • 14-Tage-Frist ✓
  • Muster-Widerrufsformular ✓
  • Empfaenger (DER SPIEGEL Abonnentenservice) ✓
  • Ausnahme digitale Inhalte ✓

Offener Punkt: Cross-Document Intelligence — System muss erkennen dass der Text keine Widerrufsbelehrung ist und den AGB-Link vorschlagen.


Erkannte Dienste (31/32 = 97%)

Dienst Kategorie Land EU In DSI erwaehnt
Adobe tracking US Nein Ja
Bluesky social US Nein Ja
Facebook social US Nein Ja
Giphy content US Nein Ja
Google Ads marketing US Nein Ja
Google reCAPTCHA security US Nein Ja
ID5 identity GB Ja Ja
IQD marketing DE Ja Ja
Imgur content US Nein Ja
Instagram social US Nein Ja
JW Player video US Nein Ja
LinkedIn marketing US Nein Ja
Mapbox maps US Nein Ja
Meta Platforms social US Nein Ja
Microsoft cloud US Nein Ja
Omnystudio audio CA Nein Ja
PayPal payment US Nein Ja
Qualtrics survey US Nein Ja
Reddit social US Nein Ja
Salesforce crm US Nein Ja
Segment tag_manager US Nein Ja
Sourcepoint cmp US Nein Ja
Spotify audio SE Ja Ja
Storifyme content DE Ja Ja
TikTok social IE Ja Ja
Utiq tracking BE Ja Ja
Vimeo video US Nein Ja
X/Twitter social US Nein Ja
YouTube video US Nein Ja
Zendesk chatbot US Nein Ja

25 Non-EU Dienste, 6 EU-Dienste. Alle in DSI erwaehnt (Spiegel dokumentiert seine Dienste gut).


Fixes die in dieser Session angewendet wurden

# Bug Fix Auswirkung
1 Text-Limit 50k Zeichen → 200k DSI: 6461→13698 Woerter, 5 FN weg
2 USt-IdNr "Umsatzsteuer-ID:" Regex erweitert Impressum: +1 PASS
3 V.i.S.d.P. "i.S.v. §18 MStV" Regex + Pattern Impressum: +1 PASS
4 "anwalt" FP im Profiler Nur Impressum[:500], nur "rechtsanwalt" Profiler: FP weg
5 Service-Erkennung 20→118 service_detector.py 5→31 Dienste erkannt
6 Section-Splitter auto-fill auto_fill_from_dsi() Cookie+Social Media auto-gefuellt

Offene Punkte

  1. Widerruf falsch zugewiesen — System braucht Cross-Document Intelligence (AGB-Link finden)
  2. Cookie-RL 1/6 — Cookie-Infos stehen im Banner, nicht im Text → TCF-Vendor-Extraktion wuerde helfen
  3. Dienste UI zeigt nur 10 — 31 erkannt aber Frontend kuerzt
  4. Berufsrecht FP — "Berufsrechtliche Regelungen + Zugang" matcht falsch im Spiegel-Impressum
  5. Banner-Check nicht sichtbar — Sourcepoint-Buttons nicht klickbar im Scanner