{/* Table of Contents Sidebar */}
{showToc && (
)}
{/* Main Content */}
{/* Header */}
DSGVO-Audit-Dokumentation
OCR-Labeling-System | Version 1.0.0 | 21. Januar 2026
{/* Document Content */}
{/* Title */}
DSGVO-Audit-Dokumentation: OCR-Labeling-System für Handschrifterkennung
Dokumentversion: 1.0.0
Datum: 21. Januar 2026
Klassifizierung: Vertraulich - Nur für internen Gebrauch und Auditoren
Nächste Überprüfung: 21. Januar 2027
{/* Section 1: Management Summary */}
1. Management Summary
1.1 Systemübersicht
Das OCR-Labeling-System ist eine vollständig lokal betriebene Lösung zur Digitalisierung und Auswertung handschriftlicher Schülerarbeiten (Klausuren, Aufsätze). Das System nutzt:
llama3.2-vision:11b - Open-Source Vision-Language-Modell für OCR (lokal via Ollama)
TrOCR - Microsoft Transformer OCR für Handschrifterkennung (lokal)
qwen2.5:14b - Open-Source LLM für Korrekturassistenz (lokal via Ollama)
1.2 Datenschutz-Garantien
1.3 Compliance-Status
Das System erfüllt die Anforderungen der:
DSGVO (Verordnung (EU) 2016/679)
BDSG (Bundesdatenschutzgesetz)
Niedersächsisches Schulgesetz (NSchG) §31
EU AI Act (Verordnung (EU) 2024/1689)
{/* Section 2: Verzeichnis der Verarbeitungstätigkeiten */}
2. Verzeichnis der Verarbeitungstätigkeiten (Art. 30 DSGVO)
2.1 Verantwortlicher
2.2 Datenschutzbeauftragter
2.3 Verarbeitungstätigkeiten
2.3.1 OCR-Verarbeitung von Klausuren
2.3.2 Labeling für Modell-Training
{/* Section 3: Rechtsgrundlagen */}
3. Rechtsgrundlagen (Art. 6 DSGVO)
3.1 Primäre Rechtsgrundlagen
3.2 Landesrechtliche Grundlagen
Niedersachsen:
§31 NSchG: Erhebung, Verarbeitung und Nutzung personenbezogener Daten
Ergänzende Bestimmungen zur VO-DV I
Interesse-Abwägung für Training (Art. 6 Abs. 1 lit. f):
3.3 Besondere Kategorien (Art. 9 DSGVO)
Prüfung auf besondere Kategorien:
Handschriftproben könnten theoretisch Rückschlüsse auf Gesundheitszustände ermöglichen (z.B. Tremor). Dies wird wie folgt adressiert:
OCR-Modelle analysieren ausschließlich Textinhalt, nicht Handschriftcharakteristiken
Keine Speicherung von Handschriftanalysen
Bei Training werden nur Textinhalte verwendet, keine biometrischen Merkmale
Ergebnis: Art. 9 ist nicht anwendbar, da keine Verarbeitung besonderer Kategorien erfolgt.
{/* Section 4: DSFA */}
4. Datenschutz-Folgenabschätzung (Art. 35 DSGVO)
4.1 Schwellwertanalyse - Erforderlichkeit der DSFA
Ergebnis: DSFA erforderlich aufgrund KI-Einsatz und Verarbeitung von Daten Minderjähriger.
NEU: Das Voice Service implementiert eine Voice-First Schnittstelle fuer Lehrkraefte mit
PersonaPlex-7B (Full-Duplex Speech-to-Speech) und TaskOrchestrator (Agent-Orchestrierung).
Alle Audiodaten werden ausschliesslich transient im RAM verarbeitet und niemals persistiert.
KRITISCH: Audio-Daten dürfen unter keinen Umständen persistiert werden (AUDIO_PERSISTENCE=false).
Dies ist eine harte DSGVO-Anforderung zum Schutz der Privatsphäre.
17.3 Verschlüsselung
Wichtig: Der Server erhält niemals den Klartext-Schlüssel. Es wird nur ein SHA-256 Hash
zur Verifizierung übermittelt. Alle sensiblen Daten werden vor der Übertragung client-seitig verschlüsselt.
17.4 TTL & Automatische Löschung
Compliance: Die TTL-basierte Auto-Löschung ist durch Valkey-Mechanismen sichergestellt und
erfordert keine manuelle Intervention.
Das BQAS (Breakpilot Quality Assurance System) nutzt einen lokalen Scheduler anstelle von GitHub Actions.
Dies gewährleistet, dass keine Testdaten oder Ergebnisse an externe Cloud-Dienste übertragen werden.
18.2 Datenschutz-Vorteile
DSGVO-Konformität: Der lokale Scheduler verarbeitet alle Testdaten ausschließlich auf dem schuleigenen Mac Mini.
Es erfolgt keine Übertragung von Schülerdaten, Testergebnissen oder Modell-Outputs an externe Server.
18.3 Komponenten
Der lokale Scheduler besteht aus folgenden Komponenten:
Folgende Daten werden während der Test-Ausführung verarbeitet:
Wichtig: Die Test-Inputs (Golden Suite YAML-Dateien) enthalten keine echten Schülerdaten,
sondern ausschließlich synthetische Beispiele zur Qualitätssicherung der Intent-Erkennung und RAG-Funktionalität.
18.5 Benachrichtigungen
Das Notifier-Modul unterstützt verschiedene Benachrichtigungskanäle:
Empfohlene Konfiguration für maximale Datenschutz-Konformität:
{`# Nur lokale Benachrichtigungen (Standard)
BQAS_NOTIFY_DESKTOP=true
BQAS_NOTIFY_SLACK=false
BQAS_NOTIFY_EMAIL=false
# Benachrichtigungs-Inhalt (ohne PII):
# - Status: success/failure/warning
# - Anzahl bestandener/fehlgeschlagener Tests
# - Test-IDs (keine Schülernamen oder Inhalte)`}