From f5d5d6c59cbbcfdffd9a19187ba572b68cffcac8 Mon Sep 17 00:00:00 2001 From: Benjamin Admin Date: Mon, 23 Mar 2026 08:54:22 +0100 Subject: [PATCH] docs: add Vision, Roadmap, and Hardware strategy to MkDocs Add three new Projekt documentation pages covering product vision (offline-first desktop app for teachers), 6-phase development roadmap, and 3-tier hardware strategy with distribution plan. Co-Authored-By: Claude Opus 4.6 --- docs-src/projekt/hardware-und-distribution.md | 233 ++++++++++++++++++ docs-src/projekt/roadmap.md | 152 ++++++++++++ docs-src/projekt/vision-und-mission.md | 191 ++++++++++++++ mkdocs.yml | 4 + 4 files changed, 580 insertions(+) create mode 100644 docs-src/projekt/hardware-und-distribution.md create mode 100644 docs-src/projekt/roadmap.md create mode 100644 docs-src/projekt/vision-und-mission.md diff --git a/docs-src/projekt/hardware-und-distribution.md b/docs-src/projekt/hardware-und-distribution.md new file mode 100644 index 0000000..a43928a --- /dev/null +++ b/docs-src/projekt/hardware-und-distribution.md @@ -0,0 +1,233 @@ +# Hardware-Anforderungen & Distribution + +**Stand:** 2026-03-23 + +--- + +## 3-Tier Hardware-Strategie + +Nicht jeder Lehrer hat dieselbe Hardware. Statt "alles oder nichts" definieren wir drei klare Tiers: + +### Tier 1: Basis (jedes Geraet mit 4+ GB RAM) + +**Gedruckt-OCR + Arbeitsblaetter + Tests — funktioniert ueberall.** + +| Feature | Status | +|---------|--------| +| Tesseract OCR (gedruckt) | ~30 MB Modell, ~200 MB RAM | +| RapidOCR / PP-OCRv5 (ONNX) | ~40 MB Modell, ~300 MB RAM | +| Vokabel-Arbeitsblaetter generieren | Regelbasiert, kein ML | +| Multiple-Choice / Lueckentexte | Regelbasiert | +| Notenspiegel-Berechnung | Statistik | +| PDF-Export | Deterministische Templates | +| Rechtschreibpruefung | ~5 MB Woerterbuch | + +**Speicherbedarf:** ~300 MB App + Modelle + +**Laeuft auf:** + +- Jeder Windows-Laptop (4+ GB RAM, beliebige CPU) +- iPad (alle Generationen inkl. Basis-iPad) +- Android-Tablet ab 4 GB RAM (Galaxy Tab A8/A9) +- Chromebook (4 GB RAM) +- MacBook (alle) + +--- + +### Tier 2: Erweitert (8+ GB RAM, moderne CPU) + +**+ Handschrift-OCR — typischer Lehrer-Laptop oder iPad Air.** + +| Feature | Zusaetzlich zu Tier 1 | +|---------|----------------------| +| TrOCR Handschrift-OCR (int8 quantisiert) | ~560 MB Modell, ~1.5 GB RAM | +| Text-Embeddings (MiniLM) | ~90 MB Modell, ~100 MB RAM | +| OpenCV Layout-/Grafik-Analyse | ~400 MB RAM (bei A4 300 DPI) | +| Lokale Vektorsuche | Eingebettete DB | + +**Speicherbedarf:** ~1.0-1.3 GB App + Modelle + +**Mindestanforderungen:** + +| Spec | Minimum | Empfohlen | +|------|---------|-----------| +| **RAM** | 8 GB | 16 GB | +| **CPU** | Intel i5 10. Gen / Apple M1 / Snapdragon 8 Gen 1 | Intel i5 12. Gen+ / Apple M2+ | +| **Speicher frei** | 5 GB | 10 GB | +| **OS** | Windows 10, macOS 12+, iPadOS 17+ | Aktuell | + +**Laeuft auf:** + +- Windows-Laptop 8 GB RAM (typischer Lehrer-Dienstlaptop, z.B. Lenovo L15 i5) — **~60-150 Sek/Seite Handschrift-OCR** +- MacBook Air M1+ 8 GB — **~30-60 Sek/Seite** (Neural Engine Beschleunigung) +- iPad Air M2+ (8 GB) — mit CoreML Konvertierung, **~20-40 Sek/Seite** +- iPad Pro M4+ (12-16 GB) — komfortabel +- Samsung Galaxy Tab S8/S9 (8 GB) — mit NNAPI/QNN, **~30-50 Sek/Seite** + +**Laeuft NICHT auf:** + +- iPad Basis (4-6 GB RAM) — iOS killt den Prozess bei TrOCR +- Budget-Android-Tablets (Galaxy Tab A8/A9, 3-4 GB RAM) +- Chromebooks mit 4 GB RAM +- Windows-Laptops mit 4 GB RAM + +--- + +### Tier 3: Voll (16+ GB RAM / Cloud / Schul-Server) + +**+ KI-Gutachten + RAG + Voice — braucht LLM.** + +| Feature | Zusaetzlich zu Tier 2 | +|---------|----------------------| +| KI-Gutachten-Generierung | LLM (llama3.2 ~4 GB oder Cloud) | +| RAG / EH-Suche | Qdrant + Embedding-Service | +| Voice-Assistent | Whisper + LLM | +| KI-Worksheet-Modifikation | Vision-LLM | + +**Optionen:** + +| Variante | Hardware | Kosten | +|----------|---------|--------| +| **Schul-Server** | Mac Mini oder vergleichbar (Specs noch zu ermitteln) | Noch zu ermitteln | +| **Cloud** | BreakPilot Cloud-Service (gehostet) | Monatlich | +| **Lehrer-PC 16+ GB** | Lokales Ollama mit kleinen LLMs | 0 (eigene Hardware) | + +!!! note "Server-Anforderungen noch offen" + Die genauen Hardware-Anforderungen fuer einen Schul-Server (RAM, CPU, Speicher) muessen im Projektverlauf durch Benchmarks ermittelt werden. Unsere Entwicklungsmaschine ist ein Mac Mini M4 Pro mit 64 GB RAM (~3.200 EUR) — das ist aber die Obergrenze, nicht die Empfehlung. Moeglicherweise reicht fuer den Schulbetrieb deutlich weniger. + +--- + +## Typische Lehrer-Hardware in Deutschland (2024-2026) + +### Digitalpakt-Kontext + +- **Digitalpakt 1.0** (2019-2024): 6,5 Mrd. EUR, 97% der Mittel abgerufen +- **Digitalpakt 2.0** (2025-2030): 5 Mrd. EUR, Fokus Infrastruktur + Geraete +- Beschafft werden: Tablets, Laptops, interaktive Whiteboards, WLAN + +### Was Schulen kaufen + +| Geraet | Typische Specs | Preis | Verbreitung | +|--------|---------------|-------|-------------| +| **iPad (Basis)** | A16 Chip, 6 GB RAM, 64-128 GB | ~350-400 EUR | Sehr hoch | +| **iPad Air** | M2/M3 Chip, 8 GB RAM, 128-512 GB | ~520-650 EUR | Hoch | +| **Lehrer-Laptop** | Intel i5 10. Gen, 8 GB RAM, 256 GB SSD | ~400-600 EUR | Standard | +| **Samsung Galaxy Tab A** | 3-4 GB RAM, 32-128 GB | ~230-280 EUR | Gering | +| **Chromebook** | 4 GB RAM | ~250-350 EUR | Minimal (in DE) | + +!!! info "iPad dominiert" + iPads sind an fast allen Schulen in Deutschland der Standard. Die meisten Schulen beschaffen iPad (Basis) oder iPad Air ueber MDM-Loesungen wie JAMF. + +--- + +## Modell-Groessen und RAM-Bedarf + +| Modell | Float32 | Int8 (quantisiert) | RAM | +|--------|---------|-------------------|-----| +| TrOCR-large Handschrift | 2.23 GB | **~560 MB** | 3-4 GB / **1-1.5 GB** | +| RapidOCR / PP-OCRv5 | ~40-90 MB | — | 200-500 MB | +| Tesseract (DE+EN) | ~30-50 MB | — | 200-300 MB | +| MiniLM Embeddings | ~90 MB | ~43 MB | 50-110 MB | +| pyspellchecker | ~5 MB | — | <10 MB | +| OpenCV (A4 300 DPI) | — | — | 200-400 MB | +| **Gesamt Offline-Kern** | **~2.6-3.0 GB** | **~1.0-1.3 GB** | **5-7 GB / 3-4.5 GB** | + +!!! warning "TrOCR ist der Flaschenhals" + TrOCR-large (2.23 GB float32) **muss** als int8 ONNX quantisiert werden fuer 8 GB Geraete. Ohne Quantisierung laeuft es nur auf 16+ GB Hardware. Alternativ: TrOCR-base (~1.3 GB float32, ~330 MB int8) mit moderatem Qualitaetsverlust. + +--- + +## ONNX Runtime: Plattform-Support + +| Plattform | ONNX Runtime | Hardware-Beschleunigung | +|-----------|-------------|------------------------| +| **Windows** | Ja (nativ) | CPU, DirectML, OpenVINO | +| **macOS** | Ja (nativ) | CPU, **CoreML** (Neural Engine, 3.5x schneller) | +| **iOS** | Ja (ORT Mobile) | **CoreML** EP, XNNPACK | +| **Android** | Ja (ORT Mobile) | **NNAPI** EP, QNN EP, XNNPACK | +| **ChromeOS (Crostini)** | Ja (Linux-Binary) | Nur CPU | +| **Browser (WASM)** | Ja, aber **15-17x langsamer** als nativ | WebGPU (5x langsamer als nativ GPU) | + +!!! note "Apple-Geraete am besten" + Durch CoreML + Neural Engine sind Apple-Geraete (M1+ Mac, iPad Air/Pro) die beste Consumer-Hardware fuer unsere Modelle. ~3.5x schneller als reines CPU-Inference. + +--- + +## Distributions-Strategie + +### Desktop (Primaer: Lehrer-Laptops) + +| Plattform | Methode | Anmerkung | +|-----------|---------|-----------| +| **Windows** | .exe/.msi Installer von Website | Code-Signing-Zertifikat empfohlen (~300 EUR/Jahr) | +| **macOS** | .dmg von Website | Apple Notarization erforderlich (99 EUR/Jahr Developer Account) | +| **Linux** | AppImage oder .deb | Keine Signierung noetig | + +**1-2 GB Installer ist fuer Desktop voellig normal** (VSCode, Slack, etc. sind aehnlich gross). + +### Tablets (Sekundaer: iPads, Android) + +| Plattform | Methode | Anmerkung | +|-----------|---------|-----------| +| **iOS/iPadOS** | Apple Custom Apps via Apple Business Manager + MDM | Nicht im oeffentlichen App Store, nur fuer Schulen via JAMF/Mosyle | +| **Android** | Managed Google Play (private Channel) | Fuer Schulen mit Google Workspace for Education | + +**Strategie:** Kleine App (~50-100 MB Initial-Download), Modelle werden beim ersten Start nachgeladen mit Fortschrittsanzeige. + +### App Store Limits + +| Store | Max. Download | On-Demand Assets | +|-------|-------------|-----------------| +| **Apple App Store** | 4 GB | Bis 20 GB (On-Demand Resources) | +| **Google Play** | 200 MB (AAB) | Bis 2 GB+ (Play Asset Delivery) | +| **Microsoft Store** | 10 GB | — | + +!!! info "1-2 GB App-Groesse kein Problem" + Games sind routinemaessig 2-5 GB. Fuer B2B-Education-Apps via MDM ist die Groesse kein Hindernis, da IT-Admins die Verteilung steuern. + +### Warum KEIN PWA? + +Progressive Web Apps sind **nicht geeignet** fuer unseren Offline-KI-Anwendungsfall: + +- iOS Safari begrenzt Storage auf ~1 GB pro Origin und **kann Daten jederzeit loeschen** +- WebAssembly ONNX Runtime ist **15-17x langsamer** als native Ausfuehrung +- Kein zuverlaessiger persistenter Speicher fuer 1+ GB Modelldaten +- PWA waere akzeptabel als leichtgewichtiger Companion (Dashboard, Ergebnisse ansehen), aber nicht fuer OCR/ML-Workloads + +--- + +## Framework-Empfehlung + +| Plattform | Framework | Vorteil | +|-----------|-----------|---------| +| **Desktop** | **Tauri** (Rust + Web-Frontend) | 5-10 MB Basis (vs. 200 MB Electron), beste ML-Integration via Rust | +| **Desktop (Alternative)** | Electron | Schnellste Entwicklung wenn Team Web-fokussiert | +| **Mobile** | **Flutter** | Single Codebase iOS+Android, gute FFI fuer native ML-Libs | +| **Mobile (Alternative)** | React Native | Wenn Frontend-Team bereits React-erfahren | + +!!! warning "Desktop und Mobile nicht in einer Codebase" + Die UX-Anforderungen sind zu unterschiedlich. Desktop = volle OCR-Pipeline + Korrektur-Workspace. Mobile = Scannen, Ergebnisse ansehen, Lernunits bearbeiten. + +--- + +## Empfohlene Hardware fuer Schulen + +### Minimum (Tier 2 — Handschrift-OCR offline) + +> **Lehrer-Laptop:** Intel i5 (10. Gen+) oder Apple M1+, **8 GB RAM**, 256 GB SSD, Windows 10/11 oder macOS 12+ +> +> **Oder iPad Air M2+** mit 128 GB Speicher + +### Optimal (Tier 3 — alle Features offline) + +> **Schul-Server:** Hardware-Anforderungen noch zu ermitteln. +> +> Muss LLMs lokal ausfuehren (Ollama) und als RAG-Server fuer die Schule dienen. +> Lehrer verbinden sich ueber WLAN und nutzen Tier-3-Features ueber den Server. +> +> *Referenz: Unsere Entwicklungsmaschine (Mac Mini M4 Pro, 64 GB RAM, ~3.200 EUR) laeuft komfortabel. Ob ein guenstigeres Modell (z.B. 32 GB RAM, ~1.500-2.000 EUR) ausreicht, wird im Projektverlauf durch Benchmarks geklaert.* + +### Oder: BreakPilot Cloud + +> Schulen ohne eigenen Server koennen Tier-3-Features ueber den BreakPilot Cloud-Service nutzen. +> Tier 1 + 2 funktionieren immer offline auf dem Endgeraet. diff --git a/docs-src/projekt/roadmap.md b/docs-src/projekt/roadmap.md new file mode 100644 index 0000000..45379a6 --- /dev/null +++ b/docs-src/projekt/roadmap.md @@ -0,0 +1,152 @@ +# Entwicklungsroadmap + +**Stand:** 2026-03-23 + +--- + +## Ueberblick + +```mermaid +graph LR + P1[Phase 1
OCR Haerten] --> P2[Phase 2
Lernunits] + P1 --> P4[Phase 4
Korrektur] + P2 --> P3[Phase 3
Schuljahr] + P4 --> P5[Phase 5
Zeugnisse] + P5 --> P6[Phase 6
Onboarding] +``` + +Phase 2 (Lernunits) und Phase 4 (Korrektur) koennen **parallel** laufen. + +--- + +## Phase 1: OCR-Pipeline Haerten (April 2026) + +**Ziel:** OCR-Pipeline robust genug fuer alle gaengigen Schulbuch-Layouts. + +| Task | Beschreibung | Aufwand | +|------|-------------|---------| +| IPA-Korrekturen | Garbled OCR-IPA in Headword-Zellen ersetzen | Klein | +| PP-DocLayout ONNX | Bessere Grafik-/Bilderkennung via ONNX-Konvertierung | Mittel | +| Page-Crop Determinismus | Spine-Shadow-Bug in `page_crop.py` fixen | Klein | +| TrOCR Finetuning | Handschrift-OCR Qualitaet mit Labeling-Daten verbessern | Gross | +| TrOCR ONNX + Int8 | Modell fuer Offline-Deployment quantisieren (~560 MB statt 2.2 GB) | Mittel | +| Ground-Truth erweitern | Regression-Test-Basis auf 10+ Sessions | Klein | + +**Ergebnis:** Zuverlaessige OCR fuer gedruckte Texte + erste brauchbare Handschrift-Erkennung auf Consumer-Hardware. + +--- + +## Phase 2: Lernunit-Generator (Mai-Juni 2026) + +**Ziel:** Aus OCR-Daten automatisch Lernmodule in verschiedenen Formaten generieren. + +| Task | Beschreibung | Aufwand | +|------|-------------|---------| +| Multiple-Choice-Generator | Automatisch aus extrahierten Vokabeln | Mittel | +| Lueckentext-Generator | Saetze mit Luecken aus OCR-Text | Mittel | +| Lernplakat-Generator | Druckbare Zusammenfassungen als PDF | Mittel | +| Grammatik-Test-Generator | Regelbasiert, kein LLM noetig | Gross | +| Spaced-Repetition-Engine | Leitner-System fuer Vokabel-Wiederholung | Mittel | +| Companion-App erweitern | Schueler-Player fuer alle Unit-Formate | Mittel | + +**Abhaengigkeit:** Vokabel-Extraktion aus Phase 1 (existiert bereits). + +**Ergebnis:** Lehrer scannt Buchseite → System generiert 5+ Lernunit-Varianten. + +--- + +## Phase 3: Schuljahres-Begleitung (Juli-August 2026) + +**Ziel:** Proaktives System das den Lehrer durch das Schuljahr fuehrt. + +| Task | Beschreibung | Aufwand | +|------|-------------|---------| +| Schulkalender-Import | ICS-Format, Bundesland-spezifische Ferien | Klein | +| Phasen-Engine erweitern | State Machine fuer Schuljahres-Phasen | Mittel | +| Automatische Erinnerungen | 3 Wochen / 1 Woche vor KA via Matrix | Mittel | +| Lernunit-Versand an Eltern | Automatischer Versand via Matrix-Chat | Klein | +| Fortschritts-Dashboard | Uebersicht: Wer hat was gelernt? Wo sind Schwaechen? | Mittel | +| Eltern-View | Vereinfachte Ansicht fuer Eltern in Studio v2 | Mittel | + +**Abhaengigkeit:** Lernunit-Generator aus Phase 2, Matrix-Anbindung (existiert). + +**Ergebnis:** System erinnert automatisch an kommende Klassenarbeiten, verschickt Lernmaterial. + +--- + +## Phase 4: Klausur-Korrektur Komplett (September-Oktober 2026) + +**Ziel:** Vollstaendiger Korrektur-Workflow inkl. deterministische Gutachten. + +| Task | Beschreibung | Aufwand | +|------|-------------|---------| +| Handschrift-OCR Integration | TrOCR in Korrektur-Workflow einbinden | Mittel | +| EH-Abgleich | Keyword-Matching gegen NiBiS-Erwartungshorizonte | Mittel | +| RS/Grammatik-Pruefung | Automatisch auf OCR-erkanntem Text | Mittel | +| Gutachten-Template-Engine | Deterministische Gutachten aus Korrekturdaten | Gross | +| Konsistenz-Check | Automatischer Abgleich ueber alle 24 Gutachten | Mittel | +| Zweitgutachter-Workflow | Visibility-Regeln, Einigung, Drittkorrektur | Mittel | +| NiBiS EH-RAG | Erwartungshorizonte in RAG ingestieren (Erweiterung der bestehenden Compliance-RAG-Pipeline) | Mittel | + +**Abhaengigkeit:** Handschrift-OCR aus Phase 1, RAG-Pipeline (existiert fuer Compliance, muss fuer NiBiS erweitert werden). + +**Ergebnis:** Lehrer scannt Klausur → System liefert RS/Grammatik-Fehler + EH-Abgleich + Gutachten-Entwurf. + +--- + +## Phase 5: Zeugnis-Generator (November-Dezember 2026) + +**Ziel:** Zeugnisse aus gesammelten Jahresdaten generieren. + +| Task | Beschreibung | Aufwand | +|------|-------------|---------| +| Zeugnis-Templates | Pro Schulform/Jahrgang fuer Niedersachsen | Gross | +| Daten-Aggregation | Alle Noten, Kompetenzen, Fehlzeiten zusammenfuehren | Mittel | +| Textbaustein-System | Deterministische Formulierungen aus Datenpunkten | Mittel | +| PDF-Export | Schulform-konforme Zeugnisse als PDF | Mittel | +| Bundesland-Konfiguration | Start Niedersachsen, erweiterbar auf andere | Klein | + +**Abhaengigkeit:** Notenspiegel (existiert), Daten aus dem gesamten Schuljahr. + +**Ergebnis:** Ein-Klick-Zeugniserstellung aus allen gesammelten Daten. + +--- + +## Phase 6: Lehrer-Onboarding + Polish (Q1 2027) + +**Ziel:** Lehrer koennen mitten im Schuljahr einsteigen. + +| Task | Beschreibung | Aufwand | +|------|-------------|---------| +| Notizbuch-OCR | Handschriftliche Notizbuecher → Klassen/Schueler anlegen | Gross | +| Status-Erkennung | System erkennt wo im Schuljahr der Lehrer steht | Mittel | +| Guided Onboarding Wizard | Schritt-fuer-Schritt Einrichtung | Mittel | +| Differenzierung | 3 Niveaus (Basis/Standard/Erweitert) fuer Lernunits | Mittel | +| Export-Formate | IMS QTI, CSV/Excel fuer Interoperabilitaet | Klein | +| Kollaborations-Features | Materialpool fuer Fachschaften | Gross | + +--- + +## Offline vs Cloud pro Phase + +| Phase | Offline (deterministisch) | Cloud/LLM (optional) | +|-------|--------------------------|---------------------| +| 1 OCR Haerten | Tesseract, RapidOCR, TrOCR, OpenCV | qwen2.5vl fuer HTR | +| 2 Lernunits | Templates, Algorithmen, Spaced Repetition | KI-Varianten | +| 3 Schuljahres-Begleitung | State-Engine, Kalender, Erinnerungen | — | +| 4 Korrektur Komplett | RS/Grammatik, Keyword-Match, Templates | KI-Gutachten, RAG | +| 5 Zeugnisse | Templates, Daten-Aggregation | KI-Textverbesserung | +| 6 Onboarding | TrOCR, Wizard, Export | — | + +--- + +## Meilensteine + +| Datum | Meilenstein | +|-------|------------| +| **April 2026** | OCR-Pipeline stabil, TrOCR quantisiert und offline-faehig | +| **Juni 2026** | Lernunit-Generator mit 5+ Formaten, Companion-Player fuer Schueler | +| **August 2026** | Schuljahres-Begleitung aktiv, automatischer Lernunit-Versand an Eltern | +| **Oktober 2026** | Klausur-Korrektur End-to-End: Scan → Gutachten (deterministisch) | +| **Dezember 2026** | Zeugnis-Generator fuer Niedersachsen produktiv | +| **Maerz 2027** | Lehrer-Onboarding aus handschriftlichen Notizbuechern, Kollaboration | diff --git a/docs-src/projekt/vision-und-mission.md b/docs-src/projekt/vision-und-mission.md new file mode 100644 index 0000000..6d89675 --- /dev/null +++ b/docs-src/projekt/vision-und-mission.md @@ -0,0 +1,191 @@ +# BreakPilot Lehrer — Vision, Mission & Projektuebersicht + +## Vision + +**Jeder Lehrer in Deutschland hat einen digitalen Assistenten, der repetitive Verwaltungsarbeit uebernimmt — offline, datenschutzkonform und auf jeder Hardware.** + +BreakPilot Lehrer befreit Lehrkraefte von Buerokratie, damit sie sich auf das konzentrieren koennen, wofuer sie Lehrer geworden sind: Unterrichten. + +--- + +## Mission + +Wir entwickeln eine **Offline-First Desktop- und Tablet-App**, die Lehrer proaktiv durch das Schuljahr begleitet. Die App erkennt handschriftliche und gedruckte Dokumente, automatisiert Korrektur-Workflows, generiert Lernmaterial und erstellt Zeugnisse — alles deterministisch, ohne Cloud-Abhaengigkeit und DSGVO-konform. + +**Unsere drei Prinzipien:** + +1. **Offline First** — Alle Kernfunktionen laufen ohne Internet, ohne GPU, auf normaler Lehrer-Hardware +2. **Deterministisch vor KI** — Jede Funktion wird zuerst regelbasiert implementiert. LLM ist optionales Upgrade, nie Kernabhaengigkeit +3. **Datenschutz by Design** — Alle Schuelerdaten bleiben lokal auf dem Geraet des Lehrers. Keine Cloud-Speicherung personenbezogener Daten + +--- + +## Das Problem + +### Korrektur: 6 Stunden pro Schueler + +Eine Deutsch-Abiturarbeit erfordert im Durchschnitt **6 Stunden Korrekturzeit pro Schueler**. Bei 24 Schuelern sitzt ein Lehrer **zwei Wochen** ausschliesslich an der Korrektur. Der Prozess ist streng reglementiert: + +1. Rechtschreibfehler markieren (Durchgang 1) +2. Grammatikfehler markieren (Durchgang 2) +3. Inhalt gegen den offiziellen Erwartungshorizont (EH) bewerten (Durchgang 3) +4. Notenspiegel ueber alle Schueler erstellen +5. Gutachten pro Schueler schreiben +6. Alle 24 Gutachten aufeinander abstimmen (Konsistenz) +7. Zweitgutachter bewertet unabhaengig +8. Bei >= 4 Punkte Differenz: Drittkorrektur + +### Verwaltung: Fragmentierte Werkzeuge + +Lehrer jonglieren zwischen handschriftlichen Notizbuechern, Excel-Tabellen, Word-Dokumenten und verschiedenen Schulportalen. Es gibt kein einheitliches System, das den Schuljahres-Rhythmus kennt und vorausschauend die richtigen Werkzeuge aktiviert. + +--- + +## Die Loesung: BreakPilot Lehrer + +### Fuer Lehrer (primaere Zielgruppe) + +| Funktion | Was es tut | Offline? | +|----------|-----------|----------| +| **Klausur-Korrektur** | Scan → OCR → RS/Grammatik-Pruefung → EH-Abgleich → Notenspiegel → Gutachten | Ja | +| **Vokabel-Arbeitsblaetter** | Buchseite scannen → Vokabeln extrahieren → 5+ Arbeitsblatt-Formate generieren | Ja | +| **Lernunit-Generator** | Aus OCR-Daten Multiple-Choice, Lueckentexte, Lernplakate erstellen | Ja | +| **Zeugnis-Generator** | Template-basierte Zeugnisse aus gesammelten Jahresdaten | Ja | +| **Notenspiegel** | Automatische Berechnung + Fairness-Analyse + Ausreisser-Erkennung | Ja | +| **Schuljahres-Planer** | Proaktive Aufgabensteuerung basierend auf Schulkalender | Ja | + +### Fuer Eltern (sekundaere Zielgruppe) + +- Erhalten automatisch generierte Lernmodule via Chat (Matrix) +- Waehlen passende Uebungen fuer ihr Kind aus +- Begleiten den Lernfortschritt mit Spaced-Repetition + +### Fuer Schueler (Endnutzer) + +- Lernen in automatisch generierten Modulen (Vokabeln, Grammatik, Multiple Choice) +- Fortschritt wird getrackt, Schwaechen erkannt +- Erinnerungen vor Klassenarbeiten + +--- + +## Automatischer Workflow (Beispiel) + +``` +Trigger: "In 3 Wochen Englisch-Klassenarbeit, Unit 4" + +1. Lehrer scannt Buchseiten 54-58 ein + | +2. OCR-Pipeline extrahiert Text, Vokabeln, Grammatik + | +3. System generiert automatisch: + - Multiple-Choice-Test + - Deutsch → Englisch Vokabelabfrage + - Englisch → Deutsch Vokabelabfrage + - Lueckentexte + - Lernplakat (druckbar) + - Grammatiktests + | +4. Lernunits gehen an Eltern via Chat + "Englisch Unit 4 — 5 Lernmodule verfuegbar" + | +5. Eltern waehlen passende Units fuer ihr Kind + | +6. Kind lernt in der App, Fortschritt wird getrackt + | +7. Automatische Erinnerungen bis zur Klassenarbeit + "Noch 5 Tage — 12 von 45 Vokabeln gelernt" +``` + +--- + +## Schuljahres-Begleitung + +Das System kennt den Schuljahresrhythmus und aktiviert proaktiv die passenden Funktionen: + +| Phase | System-Aktion | +|-------|---------------| +| **Schulbeginn** | Klassen einrichten, Schueler anlegen, Onboarding | +| **Unterrichtsphase** | Lernmaterial vorbereiten, Units aus Buchseiten erstellen | +| **3 Wochen vor Klassenarbeit** | Lernunits automatisch generieren + an Eltern senden | +| **1 Woche vor Klassenarbeit** | Erinnerungen, Fortschritt pruefen | +| **Klassenarbeit geschrieben** | Korrektur-Workflow aktivieren | +| **Nach Korrektur** | Notenspiegel erstellen, Gutachten generieren | +| **Konferenzen** | Berichte aggregieren und vorbereiten | +| **Zeugniszeit** | Zeugnis-Generator mit allen gesammelten Daten | +| **Ferien** | Wiederholungsmaterial, naechstes Halbjahr vorbereiten | + +--- + +## Technologie + +### Offline-Kern (~1.3 GB quantisiert) + +| Komponente | Technologie | Groesse | +|------------|-------------|---------| +| OCR (gedruckt) | Tesseract + RapidOCR (ONNX) | ~70 MB | +| OCR (Handschrift) | TrOCR (ONNX, int8 quantisiert) | ~560 MB | +| Layout-/Grafik-Erkennung | OpenCV | 0 | +| Rechtschreibung | pyspellchecker EN+DE | ~5 MB | +| Text-Embeddings | all-MiniLM-L6-v2 | ~90 MB | +| App + Logik | Python/TypeScript | ~200 MB | + +### Optionale Cloud-Features + +| Feature | Wofuer | Abhaengigkeit | +|---------|--------|---------------| +| KI-Gutachten | Gutachten-Vorschlaege aus Korrekturdaten | LLM (Cloud/GPU) | +| RAG / EH-Suche | Erwartungshorizont semantisch durchsuchen | Qdrant + Embedding | +| Spracheingabe | Aufgaben per Freitext einsprechen | Whisper | +| KI-Worksheet-Modifikation | Lernmaterial KI-optimiert anpassen | LLM | + +--- + +## Datenschutz (DSGVO) + +- **Alle Schuelerdaten, Noten und Klausuren bleiben lokal** auf dem Geraet des Lehrers +- Keine Cloud-Speicherung personenbezogener Daten +- Cloud-Features (wenn aktiviert) verarbeiten nur anonymisierte Daten +- Kommunikation ueber Matrix (Ende-zu-Ende-verschluesselt) +- Keine Audioaufnahmen gespeichert (Voice-Service) + +--- + +## Bundesland-Erweiterbarkeit + +Start mit **Niedersachsen** als Pilotbundesland. Die Architektur erlaubt spaetere Erweiterung auf andere Bundeslaender mit eigenen: + +- Erwartungshorizonten und Pruefungsformaten +- Notensystemen (15-Punkte vs. Noten 1-6) +- Zeugnisvorlagen und Verwaltungsvorschriften +- Schulformen und Jahrgangsstufen + +--- + +## Aktueller Stand (Maerz 2026) + +| Modul | Status | +|-------|--------| +| OCR-Pipeline (gedruckt) | 85% — Tesseract + RapidOCR + PaddleOCR, 10-Step Pipeline | +| Vokabel-Arbeitsblaetter | 90% — 4 Formate + NRU, PDF-Export | +| Klausur-Korrektur | 70% — Scan, Annotation, 5-Kriterien, Gutachten, Fairness | +| Notenspiegel | 85% — 15-Punkte, Histogramm, Ausreisser | +| Admin Dashboard | 85% — 12 Sektionen, AI-Tools, SBOM, Security | +| Studio v2 (Lehrer-UI) | 80% — 12+ Apps, 7 Sprachen, Dark/Light Mode | +| RAG / EH-Suche | 80% — Qdrant + Embedding + Hybrid Search | +| Voice-Service | 60% — WebSocket, Whisper, Intent-Router | +| Messaging | 75% — Matrix/Synapse integriert | +| Video | 70% — Jitsi integriert | +| Handschrift-OCR | 40% — TrOCR integriert, Qualitaet verbessern | +| Lernunit-Generator | 25% — Backend-API + Companion UI vorhanden | +| Zeugnis-Generator | 30% — API + Models vorhanden | +| Schuljahres-Planer | 15% — State-Engine API vorhanden | + +--- + +## Kontakt + +**BreakPilot** — KI-Bildungsplattform fuer den deutschen Schulalltag + +- Pilotphase: Niedersachsen +- Hardware: Offline auf jedem Laptop mit 8 GB RAM +- Datenschutz: DSGVO-konform, alle Daten lokal diff --git a/mkdocs.yml b/mkdocs.yml index fc8371b..c5b1d46 100644 --- a/mkdocs.yml +++ b/mkdocs.yml @@ -55,6 +55,10 @@ markdown_extensions: nav: - Start: index.md + - Projekt: + - Vision & Mission: projekt/vision-und-mission.md + - Roadmap: projekt/roadmap.md + - Hardware & Distribution: projekt/hardware-und-distribution.md - Services: - KI-Daten-Pipeline: - Uebersicht: services/ki-daten-pipeline/index.md