docs: add Vision, Roadmap, and Hardware strategy to MkDocs
Some checks failed
CI / go-lint (push) Has been skipped
CI / python-lint (push) Has been skipped
CI / nodejs-lint (push) Has been skipped
CI / test-go-school (push) Successful in 42s
CI / test-go-edu-search (push) Successful in 27s
CI / test-python-klausur (push) Failing after 1m58s
CI / test-python-agent-core (push) Successful in 16s
CI / test-nodejs-website (push) Successful in 18s
Some checks failed
CI / go-lint (push) Has been skipped
CI / python-lint (push) Has been skipped
CI / nodejs-lint (push) Has been skipped
CI / test-go-school (push) Successful in 42s
CI / test-go-edu-search (push) Successful in 27s
CI / test-python-klausur (push) Failing after 1m58s
CI / test-python-agent-core (push) Successful in 16s
CI / test-nodejs-website (push) Successful in 18s
Add three new Projekt documentation pages covering product vision (offline-first desktop app for teachers), 6-phase development roadmap, and 3-tier hardware strategy with distribution plan. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
233
docs-src/projekt/hardware-und-distribution.md
Normal file
233
docs-src/projekt/hardware-und-distribution.md
Normal file
@@ -0,0 +1,233 @@
|
|||||||
|
# Hardware-Anforderungen & Distribution
|
||||||
|
|
||||||
|
**Stand:** 2026-03-23
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## 3-Tier Hardware-Strategie
|
||||||
|
|
||||||
|
Nicht jeder Lehrer hat dieselbe Hardware. Statt "alles oder nichts" definieren wir drei klare Tiers:
|
||||||
|
|
||||||
|
### Tier 1: Basis (jedes Geraet mit 4+ GB RAM)
|
||||||
|
|
||||||
|
**Gedruckt-OCR + Arbeitsblaetter + Tests — funktioniert ueberall.**
|
||||||
|
|
||||||
|
| Feature | Status |
|
||||||
|
|---------|--------|
|
||||||
|
| Tesseract OCR (gedruckt) | ~30 MB Modell, ~200 MB RAM |
|
||||||
|
| RapidOCR / PP-OCRv5 (ONNX) | ~40 MB Modell, ~300 MB RAM |
|
||||||
|
| Vokabel-Arbeitsblaetter generieren | Regelbasiert, kein ML |
|
||||||
|
| Multiple-Choice / Lueckentexte | Regelbasiert |
|
||||||
|
| Notenspiegel-Berechnung | Statistik |
|
||||||
|
| PDF-Export | Deterministische Templates |
|
||||||
|
| Rechtschreibpruefung | ~5 MB Woerterbuch |
|
||||||
|
|
||||||
|
**Speicherbedarf:** ~300 MB App + Modelle
|
||||||
|
|
||||||
|
**Laeuft auf:**
|
||||||
|
|
||||||
|
- Jeder Windows-Laptop (4+ GB RAM, beliebige CPU)
|
||||||
|
- iPad (alle Generationen inkl. Basis-iPad)
|
||||||
|
- Android-Tablet ab 4 GB RAM (Galaxy Tab A8/A9)
|
||||||
|
- Chromebook (4 GB RAM)
|
||||||
|
- MacBook (alle)
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
### Tier 2: Erweitert (8+ GB RAM, moderne CPU)
|
||||||
|
|
||||||
|
**+ Handschrift-OCR — typischer Lehrer-Laptop oder iPad Air.**
|
||||||
|
|
||||||
|
| Feature | Zusaetzlich zu Tier 1 |
|
||||||
|
|---------|----------------------|
|
||||||
|
| TrOCR Handschrift-OCR (int8 quantisiert) | ~560 MB Modell, ~1.5 GB RAM |
|
||||||
|
| Text-Embeddings (MiniLM) | ~90 MB Modell, ~100 MB RAM |
|
||||||
|
| OpenCV Layout-/Grafik-Analyse | ~400 MB RAM (bei A4 300 DPI) |
|
||||||
|
| Lokale Vektorsuche | Eingebettete DB |
|
||||||
|
|
||||||
|
**Speicherbedarf:** ~1.0-1.3 GB App + Modelle
|
||||||
|
|
||||||
|
**Mindestanforderungen:**
|
||||||
|
|
||||||
|
| Spec | Minimum | Empfohlen |
|
||||||
|
|------|---------|-----------|
|
||||||
|
| **RAM** | 8 GB | 16 GB |
|
||||||
|
| **CPU** | Intel i5 10. Gen / Apple M1 / Snapdragon 8 Gen 1 | Intel i5 12. Gen+ / Apple M2+ |
|
||||||
|
| **Speicher frei** | 5 GB | 10 GB |
|
||||||
|
| **OS** | Windows 10, macOS 12+, iPadOS 17+ | Aktuell |
|
||||||
|
|
||||||
|
**Laeuft auf:**
|
||||||
|
|
||||||
|
- Windows-Laptop 8 GB RAM (typischer Lehrer-Dienstlaptop, z.B. Lenovo L15 i5) — **~60-150 Sek/Seite Handschrift-OCR**
|
||||||
|
- MacBook Air M1+ 8 GB — **~30-60 Sek/Seite** (Neural Engine Beschleunigung)
|
||||||
|
- iPad Air M2+ (8 GB) — mit CoreML Konvertierung, **~20-40 Sek/Seite**
|
||||||
|
- iPad Pro M4+ (12-16 GB) — komfortabel
|
||||||
|
- Samsung Galaxy Tab S8/S9 (8 GB) — mit NNAPI/QNN, **~30-50 Sek/Seite**
|
||||||
|
|
||||||
|
**Laeuft NICHT auf:**
|
||||||
|
|
||||||
|
- iPad Basis (4-6 GB RAM) — iOS killt den Prozess bei TrOCR
|
||||||
|
- Budget-Android-Tablets (Galaxy Tab A8/A9, 3-4 GB RAM)
|
||||||
|
- Chromebooks mit 4 GB RAM
|
||||||
|
- Windows-Laptops mit 4 GB RAM
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
### Tier 3: Voll (16+ GB RAM / Cloud / Schul-Server)
|
||||||
|
|
||||||
|
**+ KI-Gutachten + RAG + Voice — braucht LLM.**
|
||||||
|
|
||||||
|
| Feature | Zusaetzlich zu Tier 2 |
|
||||||
|
|---------|----------------------|
|
||||||
|
| KI-Gutachten-Generierung | LLM (llama3.2 ~4 GB oder Cloud) |
|
||||||
|
| RAG / EH-Suche | Qdrant + Embedding-Service |
|
||||||
|
| Voice-Assistent | Whisper + LLM |
|
||||||
|
| KI-Worksheet-Modifikation | Vision-LLM |
|
||||||
|
|
||||||
|
**Optionen:**
|
||||||
|
|
||||||
|
| Variante | Hardware | Kosten |
|
||||||
|
|----------|---------|--------|
|
||||||
|
| **Schul-Server** | Mac Mini oder vergleichbar (Specs noch zu ermitteln) | Noch zu ermitteln |
|
||||||
|
| **Cloud** | BreakPilot Cloud-Service (gehostet) | Monatlich |
|
||||||
|
| **Lehrer-PC 16+ GB** | Lokales Ollama mit kleinen LLMs | 0 (eigene Hardware) |
|
||||||
|
|
||||||
|
!!! note "Server-Anforderungen noch offen"
|
||||||
|
Die genauen Hardware-Anforderungen fuer einen Schul-Server (RAM, CPU, Speicher) muessen im Projektverlauf durch Benchmarks ermittelt werden. Unsere Entwicklungsmaschine ist ein Mac Mini M4 Pro mit 64 GB RAM (~3.200 EUR) — das ist aber die Obergrenze, nicht die Empfehlung. Moeglicherweise reicht fuer den Schulbetrieb deutlich weniger.
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Typische Lehrer-Hardware in Deutschland (2024-2026)
|
||||||
|
|
||||||
|
### Digitalpakt-Kontext
|
||||||
|
|
||||||
|
- **Digitalpakt 1.0** (2019-2024): 6,5 Mrd. EUR, 97% der Mittel abgerufen
|
||||||
|
- **Digitalpakt 2.0** (2025-2030): 5 Mrd. EUR, Fokus Infrastruktur + Geraete
|
||||||
|
- Beschafft werden: Tablets, Laptops, interaktive Whiteboards, WLAN
|
||||||
|
|
||||||
|
### Was Schulen kaufen
|
||||||
|
|
||||||
|
| Geraet | Typische Specs | Preis | Verbreitung |
|
||||||
|
|--------|---------------|-------|-------------|
|
||||||
|
| **iPad (Basis)** | A16 Chip, 6 GB RAM, 64-128 GB | ~350-400 EUR | Sehr hoch |
|
||||||
|
| **iPad Air** | M2/M3 Chip, 8 GB RAM, 128-512 GB | ~520-650 EUR | Hoch |
|
||||||
|
| **Lehrer-Laptop** | Intel i5 10. Gen, 8 GB RAM, 256 GB SSD | ~400-600 EUR | Standard |
|
||||||
|
| **Samsung Galaxy Tab A** | 3-4 GB RAM, 32-128 GB | ~230-280 EUR | Gering |
|
||||||
|
| **Chromebook** | 4 GB RAM | ~250-350 EUR | Minimal (in DE) |
|
||||||
|
|
||||||
|
!!! info "iPad dominiert"
|
||||||
|
iPads sind an fast allen Schulen in Deutschland der Standard. Die meisten Schulen beschaffen iPad (Basis) oder iPad Air ueber MDM-Loesungen wie JAMF.
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Modell-Groessen und RAM-Bedarf
|
||||||
|
|
||||||
|
| Modell | Float32 | Int8 (quantisiert) | RAM |
|
||||||
|
|--------|---------|-------------------|-----|
|
||||||
|
| TrOCR-large Handschrift | 2.23 GB | **~560 MB** | 3-4 GB / **1-1.5 GB** |
|
||||||
|
| RapidOCR / PP-OCRv5 | ~40-90 MB | — | 200-500 MB |
|
||||||
|
| Tesseract (DE+EN) | ~30-50 MB | — | 200-300 MB |
|
||||||
|
| MiniLM Embeddings | ~90 MB | ~43 MB | 50-110 MB |
|
||||||
|
| pyspellchecker | ~5 MB | — | <10 MB |
|
||||||
|
| OpenCV (A4 300 DPI) | — | — | 200-400 MB |
|
||||||
|
| **Gesamt Offline-Kern** | **~2.6-3.0 GB** | **~1.0-1.3 GB** | **5-7 GB / 3-4.5 GB** |
|
||||||
|
|
||||||
|
!!! warning "TrOCR ist der Flaschenhals"
|
||||||
|
TrOCR-large (2.23 GB float32) **muss** als int8 ONNX quantisiert werden fuer 8 GB Geraete. Ohne Quantisierung laeuft es nur auf 16+ GB Hardware. Alternativ: TrOCR-base (~1.3 GB float32, ~330 MB int8) mit moderatem Qualitaetsverlust.
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## ONNX Runtime: Plattform-Support
|
||||||
|
|
||||||
|
| Plattform | ONNX Runtime | Hardware-Beschleunigung |
|
||||||
|
|-----------|-------------|------------------------|
|
||||||
|
| **Windows** | Ja (nativ) | CPU, DirectML, OpenVINO |
|
||||||
|
| **macOS** | Ja (nativ) | CPU, **CoreML** (Neural Engine, 3.5x schneller) |
|
||||||
|
| **iOS** | Ja (ORT Mobile) | **CoreML** EP, XNNPACK |
|
||||||
|
| **Android** | Ja (ORT Mobile) | **NNAPI** EP, QNN EP, XNNPACK |
|
||||||
|
| **ChromeOS (Crostini)** | Ja (Linux-Binary) | Nur CPU |
|
||||||
|
| **Browser (WASM)** | Ja, aber **15-17x langsamer** als nativ | WebGPU (5x langsamer als nativ GPU) |
|
||||||
|
|
||||||
|
!!! note "Apple-Geraete am besten"
|
||||||
|
Durch CoreML + Neural Engine sind Apple-Geraete (M1+ Mac, iPad Air/Pro) die beste Consumer-Hardware fuer unsere Modelle. ~3.5x schneller als reines CPU-Inference.
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Distributions-Strategie
|
||||||
|
|
||||||
|
### Desktop (Primaer: Lehrer-Laptops)
|
||||||
|
|
||||||
|
| Plattform | Methode | Anmerkung |
|
||||||
|
|-----------|---------|-----------|
|
||||||
|
| **Windows** | .exe/.msi Installer von Website | Code-Signing-Zertifikat empfohlen (~300 EUR/Jahr) |
|
||||||
|
| **macOS** | .dmg von Website | Apple Notarization erforderlich (99 EUR/Jahr Developer Account) |
|
||||||
|
| **Linux** | AppImage oder .deb | Keine Signierung noetig |
|
||||||
|
|
||||||
|
**1-2 GB Installer ist fuer Desktop voellig normal** (VSCode, Slack, etc. sind aehnlich gross).
|
||||||
|
|
||||||
|
### Tablets (Sekundaer: iPads, Android)
|
||||||
|
|
||||||
|
| Plattform | Methode | Anmerkung |
|
||||||
|
|-----------|---------|-----------|
|
||||||
|
| **iOS/iPadOS** | Apple Custom Apps via Apple Business Manager + MDM | Nicht im oeffentlichen App Store, nur fuer Schulen via JAMF/Mosyle |
|
||||||
|
| **Android** | Managed Google Play (private Channel) | Fuer Schulen mit Google Workspace for Education |
|
||||||
|
|
||||||
|
**Strategie:** Kleine App (~50-100 MB Initial-Download), Modelle werden beim ersten Start nachgeladen mit Fortschrittsanzeige.
|
||||||
|
|
||||||
|
### App Store Limits
|
||||||
|
|
||||||
|
| Store | Max. Download | On-Demand Assets |
|
||||||
|
|-------|-------------|-----------------|
|
||||||
|
| **Apple App Store** | 4 GB | Bis 20 GB (On-Demand Resources) |
|
||||||
|
| **Google Play** | 200 MB (AAB) | Bis 2 GB+ (Play Asset Delivery) |
|
||||||
|
| **Microsoft Store** | 10 GB | — |
|
||||||
|
|
||||||
|
!!! info "1-2 GB App-Groesse kein Problem"
|
||||||
|
Games sind routinemaessig 2-5 GB. Fuer B2B-Education-Apps via MDM ist die Groesse kein Hindernis, da IT-Admins die Verteilung steuern.
|
||||||
|
|
||||||
|
### Warum KEIN PWA?
|
||||||
|
|
||||||
|
Progressive Web Apps sind **nicht geeignet** fuer unseren Offline-KI-Anwendungsfall:
|
||||||
|
|
||||||
|
- iOS Safari begrenzt Storage auf ~1 GB pro Origin und **kann Daten jederzeit loeschen**
|
||||||
|
- WebAssembly ONNX Runtime ist **15-17x langsamer** als native Ausfuehrung
|
||||||
|
- Kein zuverlaessiger persistenter Speicher fuer 1+ GB Modelldaten
|
||||||
|
- PWA waere akzeptabel als leichtgewichtiger Companion (Dashboard, Ergebnisse ansehen), aber nicht fuer OCR/ML-Workloads
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Framework-Empfehlung
|
||||||
|
|
||||||
|
| Plattform | Framework | Vorteil |
|
||||||
|
|-----------|-----------|---------|
|
||||||
|
| **Desktop** | **Tauri** (Rust + Web-Frontend) | 5-10 MB Basis (vs. 200 MB Electron), beste ML-Integration via Rust |
|
||||||
|
| **Desktop (Alternative)** | Electron | Schnellste Entwicklung wenn Team Web-fokussiert |
|
||||||
|
| **Mobile** | **Flutter** | Single Codebase iOS+Android, gute FFI fuer native ML-Libs |
|
||||||
|
| **Mobile (Alternative)** | React Native | Wenn Frontend-Team bereits React-erfahren |
|
||||||
|
|
||||||
|
!!! warning "Desktop und Mobile nicht in einer Codebase"
|
||||||
|
Die UX-Anforderungen sind zu unterschiedlich. Desktop = volle OCR-Pipeline + Korrektur-Workspace. Mobile = Scannen, Ergebnisse ansehen, Lernunits bearbeiten.
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Empfohlene Hardware fuer Schulen
|
||||||
|
|
||||||
|
### Minimum (Tier 2 — Handschrift-OCR offline)
|
||||||
|
|
||||||
|
> **Lehrer-Laptop:** Intel i5 (10. Gen+) oder Apple M1+, **8 GB RAM**, 256 GB SSD, Windows 10/11 oder macOS 12+
|
||||||
|
>
|
||||||
|
> **Oder iPad Air M2+** mit 128 GB Speicher
|
||||||
|
|
||||||
|
### Optimal (Tier 3 — alle Features offline)
|
||||||
|
|
||||||
|
> **Schul-Server:** Hardware-Anforderungen noch zu ermitteln.
|
||||||
|
>
|
||||||
|
> Muss LLMs lokal ausfuehren (Ollama) und als RAG-Server fuer die Schule dienen.
|
||||||
|
> Lehrer verbinden sich ueber WLAN und nutzen Tier-3-Features ueber den Server.
|
||||||
|
>
|
||||||
|
> *Referenz: Unsere Entwicklungsmaschine (Mac Mini M4 Pro, 64 GB RAM, ~3.200 EUR) laeuft komfortabel. Ob ein guenstigeres Modell (z.B. 32 GB RAM, ~1.500-2.000 EUR) ausreicht, wird im Projektverlauf durch Benchmarks geklaert.*
|
||||||
|
|
||||||
|
### Oder: BreakPilot Cloud
|
||||||
|
|
||||||
|
> Schulen ohne eigenen Server koennen Tier-3-Features ueber den BreakPilot Cloud-Service nutzen.
|
||||||
|
> Tier 1 + 2 funktionieren immer offline auf dem Endgeraet.
|
||||||
152
docs-src/projekt/roadmap.md
Normal file
152
docs-src/projekt/roadmap.md
Normal file
@@ -0,0 +1,152 @@
|
|||||||
|
# Entwicklungsroadmap
|
||||||
|
|
||||||
|
**Stand:** 2026-03-23
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Ueberblick
|
||||||
|
|
||||||
|
```mermaid
|
||||||
|
graph LR
|
||||||
|
P1[Phase 1<br>OCR Haerten] --> P2[Phase 2<br>Lernunits]
|
||||||
|
P1 --> P4[Phase 4<br>Korrektur]
|
||||||
|
P2 --> P3[Phase 3<br>Schuljahr]
|
||||||
|
P4 --> P5[Phase 5<br>Zeugnisse]
|
||||||
|
P5 --> P6[Phase 6<br>Onboarding]
|
||||||
|
```
|
||||||
|
|
||||||
|
Phase 2 (Lernunits) und Phase 4 (Korrektur) koennen **parallel** laufen.
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Phase 1: OCR-Pipeline Haerten (April 2026)
|
||||||
|
|
||||||
|
**Ziel:** OCR-Pipeline robust genug fuer alle gaengigen Schulbuch-Layouts.
|
||||||
|
|
||||||
|
| Task | Beschreibung | Aufwand |
|
||||||
|
|------|-------------|---------|
|
||||||
|
| IPA-Korrekturen | Garbled OCR-IPA in Headword-Zellen ersetzen | Klein |
|
||||||
|
| PP-DocLayout ONNX | Bessere Grafik-/Bilderkennung via ONNX-Konvertierung | Mittel |
|
||||||
|
| Page-Crop Determinismus | Spine-Shadow-Bug in `page_crop.py` fixen | Klein |
|
||||||
|
| TrOCR Finetuning | Handschrift-OCR Qualitaet mit Labeling-Daten verbessern | Gross |
|
||||||
|
| TrOCR ONNX + Int8 | Modell fuer Offline-Deployment quantisieren (~560 MB statt 2.2 GB) | Mittel |
|
||||||
|
| Ground-Truth erweitern | Regression-Test-Basis auf 10+ Sessions | Klein |
|
||||||
|
|
||||||
|
**Ergebnis:** Zuverlaessige OCR fuer gedruckte Texte + erste brauchbare Handschrift-Erkennung auf Consumer-Hardware.
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Phase 2: Lernunit-Generator (Mai-Juni 2026)
|
||||||
|
|
||||||
|
**Ziel:** Aus OCR-Daten automatisch Lernmodule in verschiedenen Formaten generieren.
|
||||||
|
|
||||||
|
| Task | Beschreibung | Aufwand |
|
||||||
|
|------|-------------|---------|
|
||||||
|
| Multiple-Choice-Generator | Automatisch aus extrahierten Vokabeln | Mittel |
|
||||||
|
| Lueckentext-Generator | Saetze mit Luecken aus OCR-Text | Mittel |
|
||||||
|
| Lernplakat-Generator | Druckbare Zusammenfassungen als PDF | Mittel |
|
||||||
|
| Grammatik-Test-Generator | Regelbasiert, kein LLM noetig | Gross |
|
||||||
|
| Spaced-Repetition-Engine | Leitner-System fuer Vokabel-Wiederholung | Mittel |
|
||||||
|
| Companion-App erweitern | Schueler-Player fuer alle Unit-Formate | Mittel |
|
||||||
|
|
||||||
|
**Abhaengigkeit:** Vokabel-Extraktion aus Phase 1 (existiert bereits).
|
||||||
|
|
||||||
|
**Ergebnis:** Lehrer scannt Buchseite → System generiert 5+ Lernunit-Varianten.
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Phase 3: Schuljahres-Begleitung (Juli-August 2026)
|
||||||
|
|
||||||
|
**Ziel:** Proaktives System das den Lehrer durch das Schuljahr fuehrt.
|
||||||
|
|
||||||
|
| Task | Beschreibung | Aufwand |
|
||||||
|
|------|-------------|---------|
|
||||||
|
| Schulkalender-Import | ICS-Format, Bundesland-spezifische Ferien | Klein |
|
||||||
|
| Phasen-Engine erweitern | State Machine fuer Schuljahres-Phasen | Mittel |
|
||||||
|
| Automatische Erinnerungen | 3 Wochen / 1 Woche vor KA via Matrix | Mittel |
|
||||||
|
| Lernunit-Versand an Eltern | Automatischer Versand via Matrix-Chat | Klein |
|
||||||
|
| Fortschritts-Dashboard | Uebersicht: Wer hat was gelernt? Wo sind Schwaechen? | Mittel |
|
||||||
|
| Eltern-View | Vereinfachte Ansicht fuer Eltern in Studio v2 | Mittel |
|
||||||
|
|
||||||
|
**Abhaengigkeit:** Lernunit-Generator aus Phase 2, Matrix-Anbindung (existiert).
|
||||||
|
|
||||||
|
**Ergebnis:** System erinnert automatisch an kommende Klassenarbeiten, verschickt Lernmaterial.
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Phase 4: Klausur-Korrektur Komplett (September-Oktober 2026)
|
||||||
|
|
||||||
|
**Ziel:** Vollstaendiger Korrektur-Workflow inkl. deterministische Gutachten.
|
||||||
|
|
||||||
|
| Task | Beschreibung | Aufwand |
|
||||||
|
|------|-------------|---------|
|
||||||
|
| Handschrift-OCR Integration | TrOCR in Korrektur-Workflow einbinden | Mittel |
|
||||||
|
| EH-Abgleich | Keyword-Matching gegen NiBiS-Erwartungshorizonte | Mittel |
|
||||||
|
| RS/Grammatik-Pruefung | Automatisch auf OCR-erkanntem Text | Mittel |
|
||||||
|
| Gutachten-Template-Engine | Deterministische Gutachten aus Korrekturdaten | Gross |
|
||||||
|
| Konsistenz-Check | Automatischer Abgleich ueber alle 24 Gutachten | Mittel |
|
||||||
|
| Zweitgutachter-Workflow | Visibility-Regeln, Einigung, Drittkorrektur | Mittel |
|
||||||
|
| NiBiS EH-RAG | Erwartungshorizonte in RAG ingestieren (Erweiterung der bestehenden Compliance-RAG-Pipeline) | Mittel |
|
||||||
|
|
||||||
|
**Abhaengigkeit:** Handschrift-OCR aus Phase 1, RAG-Pipeline (existiert fuer Compliance, muss fuer NiBiS erweitert werden).
|
||||||
|
|
||||||
|
**Ergebnis:** Lehrer scannt Klausur → System liefert RS/Grammatik-Fehler + EH-Abgleich + Gutachten-Entwurf.
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Phase 5: Zeugnis-Generator (November-Dezember 2026)
|
||||||
|
|
||||||
|
**Ziel:** Zeugnisse aus gesammelten Jahresdaten generieren.
|
||||||
|
|
||||||
|
| Task | Beschreibung | Aufwand |
|
||||||
|
|------|-------------|---------|
|
||||||
|
| Zeugnis-Templates | Pro Schulform/Jahrgang fuer Niedersachsen | Gross |
|
||||||
|
| Daten-Aggregation | Alle Noten, Kompetenzen, Fehlzeiten zusammenfuehren | Mittel |
|
||||||
|
| Textbaustein-System | Deterministische Formulierungen aus Datenpunkten | Mittel |
|
||||||
|
| PDF-Export | Schulform-konforme Zeugnisse als PDF | Mittel |
|
||||||
|
| Bundesland-Konfiguration | Start Niedersachsen, erweiterbar auf andere | Klein |
|
||||||
|
|
||||||
|
**Abhaengigkeit:** Notenspiegel (existiert), Daten aus dem gesamten Schuljahr.
|
||||||
|
|
||||||
|
**Ergebnis:** Ein-Klick-Zeugniserstellung aus allen gesammelten Daten.
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Phase 6: Lehrer-Onboarding + Polish (Q1 2027)
|
||||||
|
|
||||||
|
**Ziel:** Lehrer koennen mitten im Schuljahr einsteigen.
|
||||||
|
|
||||||
|
| Task | Beschreibung | Aufwand |
|
||||||
|
|------|-------------|---------|
|
||||||
|
| Notizbuch-OCR | Handschriftliche Notizbuecher → Klassen/Schueler anlegen | Gross |
|
||||||
|
| Status-Erkennung | System erkennt wo im Schuljahr der Lehrer steht | Mittel |
|
||||||
|
| Guided Onboarding Wizard | Schritt-fuer-Schritt Einrichtung | Mittel |
|
||||||
|
| Differenzierung | 3 Niveaus (Basis/Standard/Erweitert) fuer Lernunits | Mittel |
|
||||||
|
| Export-Formate | IMS QTI, CSV/Excel fuer Interoperabilitaet | Klein |
|
||||||
|
| Kollaborations-Features | Materialpool fuer Fachschaften | Gross |
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Offline vs Cloud pro Phase
|
||||||
|
|
||||||
|
| Phase | Offline (deterministisch) | Cloud/LLM (optional) |
|
||||||
|
|-------|--------------------------|---------------------|
|
||||||
|
| 1 OCR Haerten | Tesseract, RapidOCR, TrOCR, OpenCV | qwen2.5vl fuer HTR |
|
||||||
|
| 2 Lernunits | Templates, Algorithmen, Spaced Repetition | KI-Varianten |
|
||||||
|
| 3 Schuljahres-Begleitung | State-Engine, Kalender, Erinnerungen | — |
|
||||||
|
| 4 Korrektur Komplett | RS/Grammatik, Keyword-Match, Templates | KI-Gutachten, RAG |
|
||||||
|
| 5 Zeugnisse | Templates, Daten-Aggregation | KI-Textverbesserung |
|
||||||
|
| 6 Onboarding | TrOCR, Wizard, Export | — |
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Meilensteine
|
||||||
|
|
||||||
|
| Datum | Meilenstein |
|
||||||
|
|-------|------------|
|
||||||
|
| **April 2026** | OCR-Pipeline stabil, TrOCR quantisiert und offline-faehig |
|
||||||
|
| **Juni 2026** | Lernunit-Generator mit 5+ Formaten, Companion-Player fuer Schueler |
|
||||||
|
| **August 2026** | Schuljahres-Begleitung aktiv, automatischer Lernunit-Versand an Eltern |
|
||||||
|
| **Oktober 2026** | Klausur-Korrektur End-to-End: Scan → Gutachten (deterministisch) |
|
||||||
|
| **Dezember 2026** | Zeugnis-Generator fuer Niedersachsen produktiv |
|
||||||
|
| **Maerz 2027** | Lehrer-Onboarding aus handschriftlichen Notizbuechern, Kollaboration |
|
||||||
191
docs-src/projekt/vision-und-mission.md
Normal file
191
docs-src/projekt/vision-und-mission.md
Normal file
@@ -0,0 +1,191 @@
|
|||||||
|
# BreakPilot Lehrer — Vision, Mission & Projektuebersicht
|
||||||
|
|
||||||
|
## Vision
|
||||||
|
|
||||||
|
**Jeder Lehrer in Deutschland hat einen digitalen Assistenten, der repetitive Verwaltungsarbeit uebernimmt — offline, datenschutzkonform und auf jeder Hardware.**
|
||||||
|
|
||||||
|
BreakPilot Lehrer befreit Lehrkraefte von Buerokratie, damit sie sich auf das konzentrieren koennen, wofuer sie Lehrer geworden sind: Unterrichten.
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Mission
|
||||||
|
|
||||||
|
Wir entwickeln eine **Offline-First Desktop- und Tablet-App**, die Lehrer proaktiv durch das Schuljahr begleitet. Die App erkennt handschriftliche und gedruckte Dokumente, automatisiert Korrektur-Workflows, generiert Lernmaterial und erstellt Zeugnisse — alles deterministisch, ohne Cloud-Abhaengigkeit und DSGVO-konform.
|
||||||
|
|
||||||
|
**Unsere drei Prinzipien:**
|
||||||
|
|
||||||
|
1. **Offline First** — Alle Kernfunktionen laufen ohne Internet, ohne GPU, auf normaler Lehrer-Hardware
|
||||||
|
2. **Deterministisch vor KI** — Jede Funktion wird zuerst regelbasiert implementiert. LLM ist optionales Upgrade, nie Kernabhaengigkeit
|
||||||
|
3. **Datenschutz by Design** — Alle Schuelerdaten bleiben lokal auf dem Geraet des Lehrers. Keine Cloud-Speicherung personenbezogener Daten
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Das Problem
|
||||||
|
|
||||||
|
### Korrektur: 6 Stunden pro Schueler
|
||||||
|
|
||||||
|
Eine Deutsch-Abiturarbeit erfordert im Durchschnitt **6 Stunden Korrekturzeit pro Schueler**. Bei 24 Schuelern sitzt ein Lehrer **zwei Wochen** ausschliesslich an der Korrektur. Der Prozess ist streng reglementiert:
|
||||||
|
|
||||||
|
1. Rechtschreibfehler markieren (Durchgang 1)
|
||||||
|
2. Grammatikfehler markieren (Durchgang 2)
|
||||||
|
3. Inhalt gegen den offiziellen Erwartungshorizont (EH) bewerten (Durchgang 3)
|
||||||
|
4. Notenspiegel ueber alle Schueler erstellen
|
||||||
|
5. Gutachten pro Schueler schreiben
|
||||||
|
6. Alle 24 Gutachten aufeinander abstimmen (Konsistenz)
|
||||||
|
7. Zweitgutachter bewertet unabhaengig
|
||||||
|
8. Bei >= 4 Punkte Differenz: Drittkorrektur
|
||||||
|
|
||||||
|
### Verwaltung: Fragmentierte Werkzeuge
|
||||||
|
|
||||||
|
Lehrer jonglieren zwischen handschriftlichen Notizbuechern, Excel-Tabellen, Word-Dokumenten und verschiedenen Schulportalen. Es gibt kein einheitliches System, das den Schuljahres-Rhythmus kennt und vorausschauend die richtigen Werkzeuge aktiviert.
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Die Loesung: BreakPilot Lehrer
|
||||||
|
|
||||||
|
### Fuer Lehrer (primaere Zielgruppe)
|
||||||
|
|
||||||
|
| Funktion | Was es tut | Offline? |
|
||||||
|
|----------|-----------|----------|
|
||||||
|
| **Klausur-Korrektur** | Scan → OCR → RS/Grammatik-Pruefung → EH-Abgleich → Notenspiegel → Gutachten | Ja |
|
||||||
|
| **Vokabel-Arbeitsblaetter** | Buchseite scannen → Vokabeln extrahieren → 5+ Arbeitsblatt-Formate generieren | Ja |
|
||||||
|
| **Lernunit-Generator** | Aus OCR-Daten Multiple-Choice, Lueckentexte, Lernplakate erstellen | Ja |
|
||||||
|
| **Zeugnis-Generator** | Template-basierte Zeugnisse aus gesammelten Jahresdaten | Ja |
|
||||||
|
| **Notenspiegel** | Automatische Berechnung + Fairness-Analyse + Ausreisser-Erkennung | Ja |
|
||||||
|
| **Schuljahres-Planer** | Proaktive Aufgabensteuerung basierend auf Schulkalender | Ja |
|
||||||
|
|
||||||
|
### Fuer Eltern (sekundaere Zielgruppe)
|
||||||
|
|
||||||
|
- Erhalten automatisch generierte Lernmodule via Chat (Matrix)
|
||||||
|
- Waehlen passende Uebungen fuer ihr Kind aus
|
||||||
|
- Begleiten den Lernfortschritt mit Spaced-Repetition
|
||||||
|
|
||||||
|
### Fuer Schueler (Endnutzer)
|
||||||
|
|
||||||
|
- Lernen in automatisch generierten Modulen (Vokabeln, Grammatik, Multiple Choice)
|
||||||
|
- Fortschritt wird getrackt, Schwaechen erkannt
|
||||||
|
- Erinnerungen vor Klassenarbeiten
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Automatischer Workflow (Beispiel)
|
||||||
|
|
||||||
|
```
|
||||||
|
Trigger: "In 3 Wochen Englisch-Klassenarbeit, Unit 4"
|
||||||
|
|
||||||
|
1. Lehrer scannt Buchseiten 54-58 ein
|
||||||
|
|
|
||||||
|
2. OCR-Pipeline extrahiert Text, Vokabeln, Grammatik
|
||||||
|
|
|
||||||
|
3. System generiert automatisch:
|
||||||
|
- Multiple-Choice-Test
|
||||||
|
- Deutsch → Englisch Vokabelabfrage
|
||||||
|
- Englisch → Deutsch Vokabelabfrage
|
||||||
|
- Lueckentexte
|
||||||
|
- Lernplakat (druckbar)
|
||||||
|
- Grammatiktests
|
||||||
|
|
|
||||||
|
4. Lernunits gehen an Eltern via Chat
|
||||||
|
"Englisch Unit 4 — 5 Lernmodule verfuegbar"
|
||||||
|
|
|
||||||
|
5. Eltern waehlen passende Units fuer ihr Kind
|
||||||
|
|
|
||||||
|
6. Kind lernt in der App, Fortschritt wird getrackt
|
||||||
|
|
|
||||||
|
7. Automatische Erinnerungen bis zur Klassenarbeit
|
||||||
|
"Noch 5 Tage — 12 von 45 Vokabeln gelernt"
|
||||||
|
```
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Schuljahres-Begleitung
|
||||||
|
|
||||||
|
Das System kennt den Schuljahresrhythmus und aktiviert proaktiv die passenden Funktionen:
|
||||||
|
|
||||||
|
| Phase | System-Aktion |
|
||||||
|
|-------|---------------|
|
||||||
|
| **Schulbeginn** | Klassen einrichten, Schueler anlegen, Onboarding |
|
||||||
|
| **Unterrichtsphase** | Lernmaterial vorbereiten, Units aus Buchseiten erstellen |
|
||||||
|
| **3 Wochen vor Klassenarbeit** | Lernunits automatisch generieren + an Eltern senden |
|
||||||
|
| **1 Woche vor Klassenarbeit** | Erinnerungen, Fortschritt pruefen |
|
||||||
|
| **Klassenarbeit geschrieben** | Korrektur-Workflow aktivieren |
|
||||||
|
| **Nach Korrektur** | Notenspiegel erstellen, Gutachten generieren |
|
||||||
|
| **Konferenzen** | Berichte aggregieren und vorbereiten |
|
||||||
|
| **Zeugniszeit** | Zeugnis-Generator mit allen gesammelten Daten |
|
||||||
|
| **Ferien** | Wiederholungsmaterial, naechstes Halbjahr vorbereiten |
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Technologie
|
||||||
|
|
||||||
|
### Offline-Kern (~1.3 GB quantisiert)
|
||||||
|
|
||||||
|
| Komponente | Technologie | Groesse |
|
||||||
|
|------------|-------------|---------|
|
||||||
|
| OCR (gedruckt) | Tesseract + RapidOCR (ONNX) | ~70 MB |
|
||||||
|
| OCR (Handschrift) | TrOCR (ONNX, int8 quantisiert) | ~560 MB |
|
||||||
|
| Layout-/Grafik-Erkennung | OpenCV | 0 |
|
||||||
|
| Rechtschreibung | pyspellchecker EN+DE | ~5 MB |
|
||||||
|
| Text-Embeddings | all-MiniLM-L6-v2 | ~90 MB |
|
||||||
|
| App + Logik | Python/TypeScript | ~200 MB |
|
||||||
|
|
||||||
|
### Optionale Cloud-Features
|
||||||
|
|
||||||
|
| Feature | Wofuer | Abhaengigkeit |
|
||||||
|
|---------|--------|---------------|
|
||||||
|
| KI-Gutachten | Gutachten-Vorschlaege aus Korrekturdaten | LLM (Cloud/GPU) |
|
||||||
|
| RAG / EH-Suche | Erwartungshorizont semantisch durchsuchen | Qdrant + Embedding |
|
||||||
|
| Spracheingabe | Aufgaben per Freitext einsprechen | Whisper |
|
||||||
|
| KI-Worksheet-Modifikation | Lernmaterial KI-optimiert anpassen | LLM |
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Datenschutz (DSGVO)
|
||||||
|
|
||||||
|
- **Alle Schuelerdaten, Noten und Klausuren bleiben lokal** auf dem Geraet des Lehrers
|
||||||
|
- Keine Cloud-Speicherung personenbezogener Daten
|
||||||
|
- Cloud-Features (wenn aktiviert) verarbeiten nur anonymisierte Daten
|
||||||
|
- Kommunikation ueber Matrix (Ende-zu-Ende-verschluesselt)
|
||||||
|
- Keine Audioaufnahmen gespeichert (Voice-Service)
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Bundesland-Erweiterbarkeit
|
||||||
|
|
||||||
|
Start mit **Niedersachsen** als Pilotbundesland. Die Architektur erlaubt spaetere Erweiterung auf andere Bundeslaender mit eigenen:
|
||||||
|
|
||||||
|
- Erwartungshorizonten und Pruefungsformaten
|
||||||
|
- Notensystemen (15-Punkte vs. Noten 1-6)
|
||||||
|
- Zeugnisvorlagen und Verwaltungsvorschriften
|
||||||
|
- Schulformen und Jahrgangsstufen
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Aktueller Stand (Maerz 2026)
|
||||||
|
|
||||||
|
| Modul | Status |
|
||||||
|
|-------|--------|
|
||||||
|
| OCR-Pipeline (gedruckt) | 85% — Tesseract + RapidOCR + PaddleOCR, 10-Step Pipeline |
|
||||||
|
| Vokabel-Arbeitsblaetter | 90% — 4 Formate + NRU, PDF-Export |
|
||||||
|
| Klausur-Korrektur | 70% — Scan, Annotation, 5-Kriterien, Gutachten, Fairness |
|
||||||
|
| Notenspiegel | 85% — 15-Punkte, Histogramm, Ausreisser |
|
||||||
|
| Admin Dashboard | 85% — 12 Sektionen, AI-Tools, SBOM, Security |
|
||||||
|
| Studio v2 (Lehrer-UI) | 80% — 12+ Apps, 7 Sprachen, Dark/Light Mode |
|
||||||
|
| RAG / EH-Suche | 80% — Qdrant + Embedding + Hybrid Search |
|
||||||
|
| Voice-Service | 60% — WebSocket, Whisper, Intent-Router |
|
||||||
|
| Messaging | 75% — Matrix/Synapse integriert |
|
||||||
|
| Video | 70% — Jitsi integriert |
|
||||||
|
| Handschrift-OCR | 40% — TrOCR integriert, Qualitaet verbessern |
|
||||||
|
| Lernunit-Generator | 25% — Backend-API + Companion UI vorhanden |
|
||||||
|
| Zeugnis-Generator | 30% — API + Models vorhanden |
|
||||||
|
| Schuljahres-Planer | 15% — State-Engine API vorhanden |
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Kontakt
|
||||||
|
|
||||||
|
**BreakPilot** — KI-Bildungsplattform fuer den deutschen Schulalltag
|
||||||
|
|
||||||
|
- Pilotphase: Niedersachsen
|
||||||
|
- Hardware: Offline auf jedem Laptop mit 8 GB RAM
|
||||||
|
- Datenschutz: DSGVO-konform, alle Daten lokal
|
||||||
@@ -55,6 +55,10 @@ markdown_extensions:
|
|||||||
|
|
||||||
nav:
|
nav:
|
||||||
- Start: index.md
|
- Start: index.md
|
||||||
|
- Projekt:
|
||||||
|
- Vision & Mission: projekt/vision-und-mission.md
|
||||||
|
- Roadmap: projekt/roadmap.md
|
||||||
|
- Hardware & Distribution: projekt/hardware-und-distribution.md
|
||||||
- Services:
|
- Services:
|
||||||
- KI-Daten-Pipeline:
|
- KI-Daten-Pipeline:
|
||||||
- Uebersicht: services/ki-daten-pipeline/index.md
|
- Uebersicht: services/ki-daten-pipeline/index.md
|
||||||
|
|||||||
Reference in New Issue
Block a user