# Entwicklungsroadmap **Stand:** 2026-03-23 --- ## Ueberblick ```mermaid graph LR P1[Phase 1
OCR Haerten] --> P2[Phase 2
Lernunits] P1 --> P4[Phase 4
Korrektur] P2 --> P3[Phase 3
Schuljahr] P4 --> P5[Phase 5
Zeugnisse] P5 --> P6[Phase 6
Onboarding] ``` Phase 2 (Lernunits) und Phase 4 (Korrektur) koennen **parallel** laufen. --- ## Phase 1: OCR-Pipeline Haerten (April 2026) **Ziel:** OCR-Pipeline robust genug fuer alle gaengigen Schulbuch-Layouts. | Task | Beschreibung | Aufwand | |------|-------------|---------| | IPA-Korrekturen | Garbled OCR-IPA in Headword-Zellen ersetzen | Klein | | PP-DocLayout ONNX | Bessere Grafik-/Bilderkennung via ONNX-Konvertierung | Mittel | | Page-Crop Determinismus | Spine-Shadow-Bug in `page_crop.py` fixen | Klein | | TrOCR Finetuning | Handschrift-OCR Qualitaet mit Labeling-Daten verbessern | Gross | | TrOCR ONNX + Int8 | Modell fuer Offline-Deployment quantisieren (~560 MB statt 2.2 GB) | Mittel | | Ground-Truth erweitern | Regression-Test-Basis auf 10+ Sessions | Klein | **Ergebnis:** Zuverlaessige OCR fuer gedruckte Texte + erste brauchbare Handschrift-Erkennung auf Consumer-Hardware. --- ## Phase 2: Lernunit-Generator (Mai-Juni 2026) **Ziel:** Aus OCR-Daten automatisch Lernmodule in verschiedenen Formaten generieren. | Task | Beschreibung | Aufwand | |------|-------------|---------| | Multiple-Choice-Generator | Automatisch aus extrahierten Vokabeln | Mittel | | Lueckentext-Generator | Saetze mit Luecken aus OCR-Text | Mittel | | Lernplakat-Generator | Druckbare Zusammenfassungen als PDF | Mittel | | Grammatik-Test-Generator | Regelbasiert, kein LLM noetig | Gross | | Spaced-Repetition-Engine | Leitner-System fuer Vokabel-Wiederholung | Mittel | | Companion-App erweitern | Schueler-Player fuer alle Unit-Formate | Mittel | **Abhaengigkeit:** Vokabel-Extraktion aus Phase 1 (existiert bereits). **Ergebnis:** Lehrer scannt Buchseite → System generiert 5+ Lernunit-Varianten. --- ## Phase 3: Schuljahres-Begleitung (Juli-August 2026) **Ziel:** Proaktives System das den Lehrer durch das Schuljahr fuehrt. | Task | Beschreibung | Aufwand | |------|-------------|---------| | Schulkalender-Import | ICS-Format, Bundesland-spezifische Ferien | Klein | | Phasen-Engine erweitern | State Machine fuer Schuljahres-Phasen | Mittel | | Automatische Erinnerungen | 3 Wochen / 1 Woche vor KA via Matrix | Mittel | | Lernunit-Versand an Eltern | Automatischer Versand via Matrix-Chat | Klein | | Fortschritts-Dashboard | Uebersicht: Wer hat was gelernt? Wo sind Schwaechen? | Mittel | | Eltern-View | Vereinfachte Ansicht fuer Eltern in Studio v2 | Mittel | **Abhaengigkeit:** Lernunit-Generator aus Phase 2, Matrix-Anbindung (existiert). **Ergebnis:** System erinnert automatisch an kommende Klassenarbeiten, verschickt Lernmaterial. --- ## Phase 4: Klausur-Korrektur Komplett (September-Oktober 2026) **Ziel:** Vollstaendiger Korrektur-Workflow inkl. deterministische Gutachten. | Task | Beschreibung | Aufwand | |------|-------------|---------| | Handschrift-OCR Integration | TrOCR in Korrektur-Workflow einbinden | Mittel | | EH-Abgleich | Keyword-Matching gegen NiBiS-Erwartungshorizonte | Mittel | | RS/Grammatik-Pruefung | Automatisch auf OCR-erkanntem Text | Mittel | | Gutachten-Template-Engine | Deterministische Gutachten aus Korrekturdaten | Gross | | Konsistenz-Check | Automatischer Abgleich ueber alle 24 Gutachten | Mittel | | Zweitgutachter-Workflow | Visibility-Regeln, Einigung, Drittkorrektur | Mittel | | NiBiS EH-RAG | Erwartungshorizonte in RAG ingestieren (Erweiterung der bestehenden Compliance-RAG-Pipeline) | Mittel | **Abhaengigkeit:** Handschrift-OCR aus Phase 1, RAG-Pipeline (existiert fuer Compliance, muss fuer NiBiS erweitert werden). **Ergebnis:** Lehrer scannt Klausur → System liefert RS/Grammatik-Fehler + EH-Abgleich + Gutachten-Entwurf. --- ## Phase 5: Zeugnis-Generator (November-Dezember 2026) **Ziel:** Zeugnisse aus gesammelten Jahresdaten generieren. | Task | Beschreibung | Aufwand | |------|-------------|---------| | Zeugnis-Templates | Pro Schulform/Jahrgang fuer Niedersachsen | Gross | | Daten-Aggregation | Alle Noten, Kompetenzen, Fehlzeiten zusammenfuehren | Mittel | | Textbaustein-System | Deterministische Formulierungen aus Datenpunkten | Mittel | | PDF-Export | Schulform-konforme Zeugnisse als PDF | Mittel | | Bundesland-Konfiguration | Start Niedersachsen, erweiterbar auf andere | Klein | **Abhaengigkeit:** Notenspiegel (existiert), Daten aus dem gesamten Schuljahr. **Ergebnis:** Ein-Klick-Zeugniserstellung aus allen gesammelten Daten. --- ## Phase 6: Lehrer-Onboarding + Polish (Q1 2027) **Ziel:** Lehrer koennen mitten im Schuljahr einsteigen. | Task | Beschreibung | Aufwand | |------|-------------|---------| | Notizbuch-OCR | Handschriftliche Notizbuecher → Klassen/Schueler anlegen | Gross | | Status-Erkennung | System erkennt wo im Schuljahr der Lehrer steht | Mittel | | Guided Onboarding Wizard | Schritt-fuer-Schritt Einrichtung | Mittel | | Differenzierung | 3 Niveaus (Basis/Standard/Erweitert) fuer Lernunits | Mittel | | Export-Formate | IMS QTI, CSV/Excel fuer Interoperabilitaet | Klein | | Kollaborations-Features | Materialpool fuer Fachschaften | Gross | --- ## Offline vs Cloud pro Phase | Phase | Offline (deterministisch) | Cloud/LLM (optional) | |-------|--------------------------|---------------------| | 1 OCR Haerten | Tesseract, RapidOCR, TrOCR, OpenCV | qwen2.5vl fuer HTR | | 2 Lernunits | Templates, Algorithmen, Spaced Repetition | KI-Varianten | | 3 Schuljahres-Begleitung | State-Engine, Kalender, Erinnerungen | — | | 4 Korrektur Komplett | RS/Grammatik, Keyword-Match, Templates | KI-Gutachten, RAG | | 5 Zeugnisse | Templates, Daten-Aggregation | KI-Textverbesserung | | 6 Onboarding | TrOCR, Wizard, Export | — | --- ## Meilensteine | Datum | Meilenstein | |-------|------------| | **April 2026** | OCR-Pipeline stabil, TrOCR quantisiert und offline-faehig | | **Juni 2026** | Lernunit-Generator mit 5+ Formaten, Companion-Player fuer Schueler | | **August 2026** | Schuljahres-Begleitung aktiv, automatischer Lernunit-Versand an Eltern | | **Oktober 2026** | Klausur-Korrektur End-to-End: Scan → Gutachten (deterministisch) | | **Dezember 2026** | Zeugnis-Generator fuer Niedersachsen produktiv | | **Maerz 2027** | Lehrer-Onboarding aus handschriftlichen Notizbuechern, Kollaboration |