Files
breakpilot-compliance/zeroclaw/docs/ground-truth/06-spiegel.md
T
Benjamin Admin b175212516
CI / detect-changes (push) Successful in 5m10s
CI / nodejs-build (push) Successful in 2m15s
CI / branch-name (push) Has been skipped
CI / guardrail-integrity (push) Has been skipped
CI / secret-scan (push) Has been skipped
CI / dep-audit (push) Has been skipped
CI / sbom-scan (push) Has been skipped
CI / validate-canonical-controls (push) Successful in 5m1s
CI / loc-budget (push) Successful in 17s
CI / go-lint (push) Has been skipped
CI / python-lint (push) Has been skipped
CI / nodejs-lint (push) Has been skipped
CI / test-go (push) Failing after 46s
CI / test-python-backend (push) Has been skipped
CI / test-python-document-crawler (push) Has been skipped
CI / test-python-dsms-gateway (push) Has been skipped
docs(gt): update Spiegel GT with verified 2026-05-14 results
DSI: 9/9 L1 (was 6/9), 13698 words (was 6461), all FNs resolved.
Social Media: 10/10 L1 (was 9/10). Services: 31 detected (was 5).
Impressum: 9/13 (USt-IdNr + V.i.S.d.P. fixed).
Widerruf: NOT correctly tested (wrong text assigned, needs Cross-Doc Intelligence).

Full service list (31 providers) documented with country + EU status.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-05-14 23:07:42 +02:00

187 lines
7.2 KiB
Markdown

# Ground Truth: Spiegel
**URL:** https://www.spiegel.de
**Typ:** Medien / Nachrichtenportal
**Datum:** 2026-05-14 (verifiziert gegen Live-Texte + System-Ergebnis)
**Volltext:** [06-spiegel-dsi-fulltext.txt](06-spiegel-dsi-fulltext.txt) (13.698 Woerter, 107.720 Zeichen)
---
## Business Profile (erwartet vs tatsaechlich)
| Feld | Erwartet | System-Ergebnis | |
|------|---------|----------------|---|
| business_type | b2c | B2C | ✓ |
| industry | media | media | ✓ |
| has_online_shop | true | true | ✓ |
| has_editorial_content | true | true | ✓ |
| is_regulated_profession | false | false | ✓ (gefixt, war FP "anwalt") |
| needs_odr | true | true | ✓ |
| detected_services | 31 | 10 angezeigt (31 intern) | UI zeigt nur Top 10 |
---
## Dokumente
| Dokumenttyp | Vorhanden | URL | System-Ergebnis |
|-------------|-----------|-----|----------------|
| DSI | Ja | https://www.spiegel.de/datenschutz-spiegel | **9/9 L1 (100%)** ✓ |
| Impressum | Ja | https://www.spiegel.de/impressum | **9/13 L1 (86%)** ✓ |
| Social Media | In DSI (Abschnitt 8) | auto-filled | **10/10 L1 (100%)** ✓ |
| Cookie-RL | In DSI (Abschnitt 4) | auto-filled | 1/6 L1 (17%) |
| AGB | Ja | https://www.spiegel.de/agb | Nicht eingegeben |
| Nutzungsbedingungen | Ja | https://www.spiegel.de/nutzungsbedingungen | 5/12 L1 (42%) |
| Widerruf | In AGB §10 | Falsch zugewiesen (NB-Text) | 0/8 L1 (0%) |
| DSB-Kontakt | In DSI | auto-filled | **9/9 L1 (100%)** ✓ |
---
## DSI (Art. 13 DSGVO) — 9/9 L1, 24/42 L2
### L1 Checks (9/9 PASS)
| Check | Erwartet | System | Beleg |
|-------|----------|--------|-------|
| Verantwortlicher | PASS | PASS (3/3) | Ericusspitze 1, 20459 Hamburg |
| DSB | PASS | PASS (1/1) | "z. Hd. der Datenschutzbeauftragten... dsb@spiegelgruppe.de" |
| Zwecke | PASS | PASS (1/1) | Adobe-Tracking, Vertragsbeziehungen etc. |
| Rechtsgrundlage | PASS | PASS (3/4) | Art. 6(1)(a), (b), (f) |
| Empfaenger | PASS | PASS (2/2) | AVV erwaehnt |
| Drittlandtransfer | PASS | PASS (1/1) | SCC erwaehnt |
| Speicherdauer | PASS | PASS (2/2) | "30 Tage", Loeschfristen |
| Betroffenenrechte | PASS | PASS (6/7) | Art. 15-18, 20, 21. Art. 22 fehlt (TP) |
| Beschwerderecht | PASS | PASS (1/1) | HmbBfDI, Art. 77 |
### L2 True Positives (korrekte Findings)
| Check | Status | Begruendung |
|-------|--------|-------------|
| Interessenabwaegung | FAIL (TP) | Interesse benannt, keine Abwaegung dokumentiert |
| Art. 22 Profiling | FAIL (TP) | Nicht erwaehnt trotz personalisierter Werbung |
---
## Impressum — 9/13 L1, 9/31 L2
| Check | Erwartet | System | |
|-------|----------|--------|---|
| Firmenname | PASS | PASS | ✓ |
| Anschrift | PASS | PASS (2/2) | ✓ |
| Kontakt | PASS | PASS (2/2) | ✓ |
| Register | PASS | PASS (2/2) | ✓ |
| USt-IdNr | PASS | PASS (1/1) | ✓ Gefixt ("Umsatzsteuer-ID:" + DE mit Leerzeichen) |
| Vertretung | PASS | PASS (1/1) | ✓ |
| V.i.S.d.P. | PASS | PASS | ✓ Gefixt ("Verantwortlicher i.S.v. §18 MStV") |
| Streitbeilegung | PASS | PASS | ✓ |
| Berufsrecht | SKIP | PASS (1/3) | FP — "Berufsrechtliche Regelungen" matcht falsch |
---
## Social Media — 10/10 L1, 12/30 L2
| Check | Erwartet | System | |
|-------|----------|--------|---|
| Gemeinsam Verantwortliche | PASS | PASS | ✓ |
| Meta benannt | PASS | PASS | ✓ "Meta Platforms Inc" erkannt |
| Vereinbarung Art. 26 | PASS | PASS (1/2) | ✓ Seiteninsights erwaehnt |
| Anlaufstelle | PASS | PASS (1/1) | ✓ |
| Plattformen | PASS | PASS (1/1) | ✓ |
| Drittlandtransfer | PASS | PASS (2/2) | ✓ SCC + DPF |
| Rechtsgrundlage | PASS | PASS (1/1) | ✓ |
| Betroffenenrechte | PASS | PASS (1/1) | ✓ Opt-Out erwaehnt |
| Social Bookmarks | PASS | PASS | ✓ |
### L2 True Positives
| Check | Status | Begruendung |
|-------|--------|-------------|
| Page Controller Addendum | FAIL (TP) | Nicht verlinkt |
| 2-Klick-Loesung | FAIL (TP) | Nicht dokumentiert |
---
## Cookie-Richtlinie — 1/6 L1
Cookie-Infos stehen bei Spiegel im **Sourcepoint-Banner** und in DSI Abschnitt 4, nicht als eigenes Dokument. Section-Splitter hat einen kurzen Cookie-Abschnitt extrahiert, aber die meisten Checks scheitern weil die Details im Banner stehen (nicht im Text).
---
## Nutzungsbedingungen — 5/12 L1
Aus spiegel.de/nutzungsbedingungen extrahiert (1679 Woerter). Echte Luecken bei Einbeziehungsklausel, ODR-Link, Kuendigung, Zahlungsarten.
---
## Widerrufsbelehrung — 0/8 L1
**Problem:** System prueft Nutzungsbedingungen-Text (1679w) statt AGB-Text.
**Tatsaechlich:** Widerrufsbelehrung steht in AGB §10 (spiegel.de/agb):
- 14-Tage-Frist ✓
- Muster-Widerrufsformular ✓
- Empfaenger (DER SPIEGEL Abonnentenservice) ✓
- Ausnahme digitale Inhalte ✓
**Offener Punkt:** Cross-Document Intelligence — System muss erkennen dass der Text keine Widerrufsbelehrung ist und den AGB-Link vorschlagen.
---
## Erkannte Dienste (31/32 = 97%)
| Dienst | Kategorie | Land | EU | In DSI erwaehnt |
|--------|----------|------|----|----------------|
| Adobe | tracking | US | Nein | Ja |
| Bluesky | social | US | Nein | Ja |
| Facebook | social | US | Nein | Ja |
| Giphy | content | US | Nein | Ja |
| Google Ads | marketing | US | Nein | Ja |
| Google reCAPTCHA | security | US | Nein | Ja |
| ID5 | identity | GB | Ja | Ja |
| IQD | marketing | DE | Ja | Ja |
| Imgur | content | US | Nein | Ja |
| Instagram | social | US | Nein | Ja |
| JW Player | video | US | Nein | Ja |
| LinkedIn | marketing | US | Nein | Ja |
| Mapbox | maps | US | Nein | Ja |
| Meta Platforms | social | US | Nein | Ja |
| Microsoft | cloud | US | Nein | Ja |
| Omnystudio | audio | CA | Nein | Ja |
| PayPal | payment | US | Nein | Ja |
| Qualtrics | survey | US | Nein | Ja |
| Reddit | social | US | Nein | Ja |
| Salesforce | crm | US | Nein | Ja |
| Segment | tag_manager | US | Nein | Ja |
| Sourcepoint | cmp | US | Nein | Ja |
| Spotify | audio | SE | Ja | Ja |
| Storifyme | content | DE | Ja | Ja |
| TikTok | social | IE | Ja | Ja |
| Utiq | tracking | BE | Ja | Ja |
| Vimeo | video | US | Nein | Ja |
| X/Twitter | social | US | Nein | Ja |
| YouTube | video | US | Nein | Ja |
| Zendesk | chatbot | US | Nein | Ja |
**25 Non-EU Dienste, 6 EU-Dienste.** Alle in DSI erwaehnt (Spiegel dokumentiert seine Dienste gut).
---
## Fixes die in dieser Session angewendet wurden
| # | Bug | Fix | Auswirkung |
|---|-----|-----|-----------|
| 1 | Text-Limit 50k Zeichen | → 200k | DSI: 6461→13698 Woerter, 5 FN weg |
| 2 | USt-IdNr "Umsatzsteuer-ID:" | Regex erweitert | Impressum: +1 PASS |
| 3 | V.i.S.d.P. "i.S.v. §18 MStV" | Regex + Pattern | Impressum: +1 PASS |
| 4 | "anwalt" FP im Profiler | Nur Impressum[:500], nur "rechtsanwalt" | Profiler: FP weg |
| 5 | Service-Erkennung 20→118 | service_detector.py | 5→31 Dienste erkannt |
| 6 | Section-Splitter auto-fill | auto_fill_from_dsi() | Cookie+Social Media auto-gefuellt |
---
## Offene Punkte
1. **Widerruf falsch zugewiesen** — System braucht Cross-Document Intelligence (AGB-Link finden)
2. **Cookie-RL 1/6** — Cookie-Infos stehen im Banner, nicht im Text → TCF-Vendor-Extraktion wuerde helfen
3. **Dienste UI zeigt nur 10** — 31 erkannt aber Frontend kuerzt
4. **Berufsrecht FP** — "Berufsrechtliche Regelungen + Zugang" matcht falsch im Spiegel-Impressum
5. **Banner-Check nicht sichtbar** — Sourcepoint-Buttons nicht klickbar im Scanner