Files
breakpilot-compliance/zeroclaw/docs/ground-truth
Benjamin Admin b175212516
CI / detect-changes (push) Successful in 5m10s
CI / nodejs-build (push) Successful in 2m15s
CI / branch-name (push) Has been skipped
CI / guardrail-integrity (push) Has been skipped
CI / secret-scan (push) Has been skipped
CI / dep-audit (push) Has been skipped
CI / sbom-scan (push) Has been skipped
CI / validate-canonical-controls (push) Successful in 5m1s
CI / loc-budget (push) Successful in 17s
CI / go-lint (push) Has been skipped
CI / python-lint (push) Has been skipped
CI / nodejs-lint (push) Has been skipped
CI / test-go (push) Failing after 46s
CI / test-python-backend (push) Has been skipped
CI / test-python-document-crawler (push) Has been skipped
CI / test-python-dsms-gateway (push) Has been skipped
docs(gt): update Spiegel GT with verified 2026-05-14 results
DSI: 9/9 L1 (was 6/9), 13698 words (was 6461), all FNs resolved.
Social Media: 10/10 L1 (was 9/10). Services: 31 detected (was 5).
Impressum: 9/13 (USt-IdNr + V.i.S.d.P. fixed).
Widerruf: NOT correctly tested (wrong text assigned, needs Cross-Doc Intelligence).

Full service list (31 providers) documented with country + EU status.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-05-14 23:07:42 +02:00
..

Ground Truth — Unified Compliance Check

Zweck

Diese Dateien definieren die erwarteten Ergebnisse fuer den Unified Compliance Check pro Website. Sie dienen als Referenz fuer:

  • Regression-Tests (automatisch)
  • Manuelle Validierung neuer Check-Regeln
  • False-Positive-Rate-Messung

Format pro Datei

Jede GT-Datei enthaelt:

  1. Website-Info — URL, Typ, Datum der Pruefung
  2. Business Profile — Erwartetes Ergebnis der automatischen Erkennung
  3. Dokumente — Welche der 8 Dokumenttypen vorhanden sind + URLs
  4. Erwartete Ergebnisse — L1/L2 Checks pro Dokument mit Begruendung
  5. Banner-Check — Erwartete Banner-Findings
  6. Cross-Check — Erwartete Banner-vs-Cookie Findings

Websites (10)

# Website Typ Besonderheit
1 SafetyKon B2B Beratung Nur DSI + Impressum, alles auf einer Seite
2 IHK Konstanz Kammer Lange DSI mit Cookie+Social+DSFA Sektionen
3 Stadt Koeln Kommune Vorbildliche DSI
4 BMW Konzern Lueckenhafte DSI
5 Sparkasse KN Finanz Kein DSB, kein Art. 77
6 Spiegel Medien Consent-Wall, kurze DSI
7 TUEV Sued Prueforg. Fehlender DSB
8 ETO Gruppe Mittelstand B2B Vorbildlich
9 Caritas Nonprofit Gut, lange DSI
10 BfDI Bundesbehoerde Kurze DSI

Aktualisierung

Ground Truth muss aktualisiert werden wenn:

  • Websites ihre Rechtstexte aendern
  • Neue Checks hinzugefuegt werden
  • False Positives/Negatives korrigiert werden

Datum der letzten Pruefung steht in jeder Datei.