b175212516
CI / detect-changes (push) Successful in 5m10s
CI / nodejs-build (push) Successful in 2m15s
CI / branch-name (push) Has been skipped
CI / guardrail-integrity (push) Has been skipped
CI / secret-scan (push) Has been skipped
CI / dep-audit (push) Has been skipped
CI / sbom-scan (push) Has been skipped
CI / validate-canonical-controls (push) Successful in 5m1s
CI / loc-budget (push) Successful in 17s
CI / go-lint (push) Has been skipped
CI / python-lint (push) Has been skipped
CI / nodejs-lint (push) Has been skipped
CI / test-go (push) Failing after 46s
CI / test-python-backend (push) Has been skipped
CI / test-python-document-crawler (push) Has been skipped
CI / test-python-dsms-gateway (push) Has been skipped
DSI: 9/9 L1 (was 6/9), 13698 words (was 6461), all FNs resolved. Social Media: 10/10 L1 (was 9/10). Services: 31 detected (was 5). Impressum: 9/13 (USt-IdNr + V.i.S.d.P. fixed). Widerruf: NOT correctly tested (wrong text assigned, needs Cross-Doc Intelligence). Full service list (31 providers) documented with country + EU status. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
187 lines
7.2 KiB
Markdown
187 lines
7.2 KiB
Markdown
# Ground Truth: Spiegel
|
|
|
|
**URL:** https://www.spiegel.de
|
|
**Typ:** Medien / Nachrichtenportal
|
|
**Datum:** 2026-05-14 (verifiziert gegen Live-Texte + System-Ergebnis)
|
|
**Volltext:** [06-spiegel-dsi-fulltext.txt](06-spiegel-dsi-fulltext.txt) (13.698 Woerter, 107.720 Zeichen)
|
|
|
|
---
|
|
|
|
## Business Profile (erwartet vs tatsaechlich)
|
|
|
|
| Feld | Erwartet | System-Ergebnis | |
|
|
|------|---------|----------------|---|
|
|
| business_type | b2c | B2C | ✓ |
|
|
| industry | media | media | ✓ |
|
|
| has_online_shop | true | true | ✓ |
|
|
| has_editorial_content | true | true | ✓ |
|
|
| is_regulated_profession | false | false | ✓ (gefixt, war FP "anwalt") |
|
|
| needs_odr | true | true | ✓ |
|
|
| detected_services | 31 | 10 angezeigt (31 intern) | UI zeigt nur Top 10 |
|
|
|
|
---
|
|
|
|
## Dokumente
|
|
|
|
| Dokumenttyp | Vorhanden | URL | System-Ergebnis |
|
|
|-------------|-----------|-----|----------------|
|
|
| DSI | Ja | https://www.spiegel.de/datenschutz-spiegel | **9/9 L1 (100%)** ✓ |
|
|
| Impressum | Ja | https://www.spiegel.de/impressum | **9/13 L1 (86%)** ✓ |
|
|
| Social Media | In DSI (Abschnitt 8) | auto-filled | **10/10 L1 (100%)** ✓ |
|
|
| Cookie-RL | In DSI (Abschnitt 4) | auto-filled | 1/6 L1 (17%) |
|
|
| AGB | Ja | https://www.spiegel.de/agb | Nicht eingegeben |
|
|
| Nutzungsbedingungen | Ja | https://www.spiegel.de/nutzungsbedingungen | 5/12 L1 (42%) |
|
|
| Widerruf | In AGB §10 | Falsch zugewiesen (NB-Text) | 0/8 L1 (0%) |
|
|
| DSB-Kontakt | In DSI | auto-filled | **9/9 L1 (100%)** ✓ |
|
|
|
|
---
|
|
|
|
## DSI (Art. 13 DSGVO) — 9/9 L1, 24/42 L2
|
|
|
|
### L1 Checks (9/9 PASS)
|
|
|
|
| Check | Erwartet | System | Beleg |
|
|
|-------|----------|--------|-------|
|
|
| Verantwortlicher | PASS | PASS (3/3) | Ericusspitze 1, 20459 Hamburg |
|
|
| DSB | PASS | PASS (1/1) | "z. Hd. der Datenschutzbeauftragten... dsb@spiegelgruppe.de" |
|
|
| Zwecke | PASS | PASS (1/1) | Adobe-Tracking, Vertragsbeziehungen etc. |
|
|
| Rechtsgrundlage | PASS | PASS (3/4) | Art. 6(1)(a), (b), (f) |
|
|
| Empfaenger | PASS | PASS (2/2) | AVV erwaehnt |
|
|
| Drittlandtransfer | PASS | PASS (1/1) | SCC erwaehnt |
|
|
| Speicherdauer | PASS | PASS (2/2) | "30 Tage", Loeschfristen |
|
|
| Betroffenenrechte | PASS | PASS (6/7) | Art. 15-18, 20, 21. Art. 22 fehlt (TP) |
|
|
| Beschwerderecht | PASS | PASS (1/1) | HmbBfDI, Art. 77 |
|
|
|
|
### L2 True Positives (korrekte Findings)
|
|
|
|
| Check | Status | Begruendung |
|
|
|-------|--------|-------------|
|
|
| Interessenabwaegung | FAIL (TP) | Interesse benannt, keine Abwaegung dokumentiert |
|
|
| Art. 22 Profiling | FAIL (TP) | Nicht erwaehnt trotz personalisierter Werbung |
|
|
|
|
---
|
|
|
|
## Impressum — 9/13 L1, 9/31 L2
|
|
|
|
| Check | Erwartet | System | |
|
|
|-------|----------|--------|---|
|
|
| Firmenname | PASS | PASS | ✓ |
|
|
| Anschrift | PASS | PASS (2/2) | ✓ |
|
|
| Kontakt | PASS | PASS (2/2) | ✓ |
|
|
| Register | PASS | PASS (2/2) | ✓ |
|
|
| USt-IdNr | PASS | PASS (1/1) | ✓ Gefixt ("Umsatzsteuer-ID:" + DE mit Leerzeichen) |
|
|
| Vertretung | PASS | PASS (1/1) | ✓ |
|
|
| V.i.S.d.P. | PASS | PASS | ✓ Gefixt ("Verantwortlicher i.S.v. §18 MStV") |
|
|
| Streitbeilegung | PASS | PASS | ✓ |
|
|
| Berufsrecht | SKIP | PASS (1/3) | FP — "Berufsrechtliche Regelungen" matcht falsch |
|
|
|
|
---
|
|
|
|
## Social Media — 10/10 L1, 12/30 L2
|
|
|
|
| Check | Erwartet | System | |
|
|
|-------|----------|--------|---|
|
|
| Gemeinsam Verantwortliche | PASS | PASS | ✓ |
|
|
| Meta benannt | PASS | PASS | ✓ "Meta Platforms Inc" erkannt |
|
|
| Vereinbarung Art. 26 | PASS | PASS (1/2) | ✓ Seiteninsights erwaehnt |
|
|
| Anlaufstelle | PASS | PASS (1/1) | ✓ |
|
|
| Plattformen | PASS | PASS (1/1) | ✓ |
|
|
| Drittlandtransfer | PASS | PASS (2/2) | ✓ SCC + DPF |
|
|
| Rechtsgrundlage | PASS | PASS (1/1) | ✓ |
|
|
| Betroffenenrechte | PASS | PASS (1/1) | ✓ Opt-Out erwaehnt |
|
|
| Social Bookmarks | PASS | PASS | ✓ |
|
|
|
|
### L2 True Positives
|
|
|
|
| Check | Status | Begruendung |
|
|
|-------|--------|-------------|
|
|
| Page Controller Addendum | FAIL (TP) | Nicht verlinkt |
|
|
| 2-Klick-Loesung | FAIL (TP) | Nicht dokumentiert |
|
|
|
|
---
|
|
|
|
## Cookie-Richtlinie — 1/6 L1
|
|
|
|
Cookie-Infos stehen bei Spiegel im **Sourcepoint-Banner** und in DSI Abschnitt 4, nicht als eigenes Dokument. Section-Splitter hat einen kurzen Cookie-Abschnitt extrahiert, aber die meisten Checks scheitern weil die Details im Banner stehen (nicht im Text).
|
|
|
|
---
|
|
|
|
## Nutzungsbedingungen — 5/12 L1
|
|
|
|
Aus spiegel.de/nutzungsbedingungen extrahiert (1679 Woerter). Echte Luecken bei Einbeziehungsklausel, ODR-Link, Kuendigung, Zahlungsarten.
|
|
|
|
---
|
|
|
|
## Widerrufsbelehrung — 0/8 L1
|
|
|
|
**Problem:** System prueft Nutzungsbedingungen-Text (1679w) statt AGB-Text.
|
|
**Tatsaechlich:** Widerrufsbelehrung steht in AGB §10 (spiegel.de/agb):
|
|
- 14-Tage-Frist ✓
|
|
- Muster-Widerrufsformular ✓
|
|
- Empfaenger (DER SPIEGEL Abonnentenservice) ✓
|
|
- Ausnahme digitale Inhalte ✓
|
|
|
|
**Offener Punkt:** Cross-Document Intelligence — System muss erkennen dass der Text keine Widerrufsbelehrung ist und den AGB-Link vorschlagen.
|
|
|
|
---
|
|
|
|
## Erkannte Dienste (31/32 = 97%)
|
|
|
|
| Dienst | Kategorie | Land | EU | In DSI erwaehnt |
|
|
|--------|----------|------|----|----------------|
|
|
| Adobe | tracking | US | Nein | Ja |
|
|
| Bluesky | social | US | Nein | Ja |
|
|
| Facebook | social | US | Nein | Ja |
|
|
| Giphy | content | US | Nein | Ja |
|
|
| Google Ads | marketing | US | Nein | Ja |
|
|
| Google reCAPTCHA | security | US | Nein | Ja |
|
|
| ID5 | identity | GB | Ja | Ja |
|
|
| IQD | marketing | DE | Ja | Ja |
|
|
| Imgur | content | US | Nein | Ja |
|
|
| Instagram | social | US | Nein | Ja |
|
|
| JW Player | video | US | Nein | Ja |
|
|
| LinkedIn | marketing | US | Nein | Ja |
|
|
| Mapbox | maps | US | Nein | Ja |
|
|
| Meta Platforms | social | US | Nein | Ja |
|
|
| Microsoft | cloud | US | Nein | Ja |
|
|
| Omnystudio | audio | CA | Nein | Ja |
|
|
| PayPal | payment | US | Nein | Ja |
|
|
| Qualtrics | survey | US | Nein | Ja |
|
|
| Reddit | social | US | Nein | Ja |
|
|
| Salesforce | crm | US | Nein | Ja |
|
|
| Segment | tag_manager | US | Nein | Ja |
|
|
| Sourcepoint | cmp | US | Nein | Ja |
|
|
| Spotify | audio | SE | Ja | Ja |
|
|
| Storifyme | content | DE | Ja | Ja |
|
|
| TikTok | social | IE | Ja | Ja |
|
|
| Utiq | tracking | BE | Ja | Ja |
|
|
| Vimeo | video | US | Nein | Ja |
|
|
| X/Twitter | social | US | Nein | Ja |
|
|
| YouTube | video | US | Nein | Ja |
|
|
| Zendesk | chatbot | US | Nein | Ja |
|
|
|
|
**25 Non-EU Dienste, 6 EU-Dienste.** Alle in DSI erwaehnt (Spiegel dokumentiert seine Dienste gut).
|
|
|
|
---
|
|
|
|
## Fixes die in dieser Session angewendet wurden
|
|
|
|
| # | Bug | Fix | Auswirkung |
|
|
|---|-----|-----|-----------|
|
|
| 1 | Text-Limit 50k Zeichen | → 200k | DSI: 6461→13698 Woerter, 5 FN weg |
|
|
| 2 | USt-IdNr "Umsatzsteuer-ID:" | Regex erweitert | Impressum: +1 PASS |
|
|
| 3 | V.i.S.d.P. "i.S.v. §18 MStV" | Regex + Pattern | Impressum: +1 PASS |
|
|
| 4 | "anwalt" FP im Profiler | Nur Impressum[:500], nur "rechtsanwalt" | Profiler: FP weg |
|
|
| 5 | Service-Erkennung 20→118 | service_detector.py | 5→31 Dienste erkannt |
|
|
| 6 | Section-Splitter auto-fill | auto_fill_from_dsi() | Cookie+Social Media auto-gefuellt |
|
|
|
|
---
|
|
|
|
## Offene Punkte
|
|
|
|
1. **Widerruf falsch zugewiesen** — System braucht Cross-Document Intelligence (AGB-Link finden)
|
|
2. **Cookie-RL 1/6** — Cookie-Infos stehen im Banner, nicht im Text → TCF-Vendor-Extraktion wuerde helfen
|
|
3. **Dienste UI zeigt nur 10** — 31 erkannt aber Frontend kuerzt
|
|
4. **Berufsrecht FP** — "Berufsrechtliche Regelungen + Zugang" matcht falsch im Spiegel-Impressum
|
|
5. **Banner-Check nicht sichtbar** — Sourcepoint-Buttons nicht klickbar im Scanner
|