# Ground Truth — Unified Compliance Check ## Zweck Diese Dateien definieren die erwarteten Ergebnisse fuer den Unified Compliance Check pro Website. Sie dienen als Referenz fuer: - Regression-Tests (automatisch) - Manuelle Validierung neuer Check-Regeln - False-Positive-Rate-Messung ## Format pro Datei Jede GT-Datei enthaelt: 1. **Website-Info** — URL, Typ, Datum der Pruefung 2. **Business Profile** — Erwartetes Ergebnis der automatischen Erkennung 3. **Dokumente** — Welche der 8 Dokumenttypen vorhanden sind + URLs 4. **Erwartete Ergebnisse** — L1/L2 Checks pro Dokument mit Begruendung 5. **Banner-Check** — Erwartete Banner-Findings 6. **Cross-Check** — Erwartete Banner-vs-Cookie Findings ## Websites (10) | # | Website | Typ | Besonderheit | |---|---------|-----|-------------| | 1 | SafetyKon | B2B Beratung | Nur DSI + Impressum, alles auf einer Seite | | 2 | IHK Konstanz | Kammer | Lange DSI mit Cookie+Social+DSFA Sektionen | | 3 | Stadt Koeln | Kommune | Vorbildliche DSI | | 4 | BMW | Konzern | Lueckenhafte DSI | | 5 | Sparkasse KN | Finanz | Kein DSB, kein Art. 77 | | 6 | Spiegel | Medien | Consent-Wall, kurze DSI | | 7 | TUEV Sued | Prueforg. | Fehlender DSB | | 8 | ETO Gruppe | Mittelstand B2B | Vorbildlich | | 9 | Caritas | Nonprofit | Gut, lange DSI | | 10 | BfDI | Bundesbehoerde | Kurze DSI | ## Aktualisierung Ground Truth muss aktualisiert werden wenn: - Websites ihre Rechtstexte aendern - Neue Checks hinzugefuegt werden - False Positives/Negatives korrigiert werden Datum der letzten Pruefung steht in jeder Datei.