docs: add Vision, Roadmap, and Hardware strategy to MkDocs
Some checks failed
CI / go-lint (push) Has been skipped
CI / python-lint (push) Has been skipped
CI / nodejs-lint (push) Has been skipped
CI / test-go-school (push) Successful in 42s
CI / test-go-edu-search (push) Successful in 27s
CI / test-python-klausur (push) Failing after 1m58s
CI / test-python-agent-core (push) Successful in 16s
CI / test-nodejs-website (push) Successful in 18s

Add three new Projekt documentation pages covering product vision
(offline-first desktop app for teachers), 6-phase development roadmap,
and 3-tier hardware strategy with distribution plan.

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
Benjamin Admin
2026-03-23 08:54:22 +01:00
parent 4a44ad7986
commit f5d5d6c59c
4 changed files with 580 additions and 0 deletions

View File

@@ -0,0 +1,233 @@
# Hardware-Anforderungen & Distribution
**Stand:** 2026-03-23
---
## 3-Tier Hardware-Strategie
Nicht jeder Lehrer hat dieselbe Hardware. Statt "alles oder nichts" definieren wir drei klare Tiers:
### Tier 1: Basis (jedes Geraet mit 4+ GB RAM)
**Gedruckt-OCR + Arbeitsblaetter + Tests — funktioniert ueberall.**
| Feature | Status |
|---------|--------|
| Tesseract OCR (gedruckt) | ~30 MB Modell, ~200 MB RAM |
| RapidOCR / PP-OCRv5 (ONNX) | ~40 MB Modell, ~300 MB RAM |
| Vokabel-Arbeitsblaetter generieren | Regelbasiert, kein ML |
| Multiple-Choice / Lueckentexte | Regelbasiert |
| Notenspiegel-Berechnung | Statistik |
| PDF-Export | Deterministische Templates |
| Rechtschreibpruefung | ~5 MB Woerterbuch |
**Speicherbedarf:** ~300 MB App + Modelle
**Laeuft auf:**
- Jeder Windows-Laptop (4+ GB RAM, beliebige CPU)
- iPad (alle Generationen inkl. Basis-iPad)
- Android-Tablet ab 4 GB RAM (Galaxy Tab A8/A9)
- Chromebook (4 GB RAM)
- MacBook (alle)
---
### Tier 2: Erweitert (8+ GB RAM, moderne CPU)
**+ Handschrift-OCR — typischer Lehrer-Laptop oder iPad Air.**
| Feature | Zusaetzlich zu Tier 1 |
|---------|----------------------|
| TrOCR Handschrift-OCR (int8 quantisiert) | ~560 MB Modell, ~1.5 GB RAM |
| Text-Embeddings (MiniLM) | ~90 MB Modell, ~100 MB RAM |
| OpenCV Layout-/Grafik-Analyse | ~400 MB RAM (bei A4 300 DPI) |
| Lokale Vektorsuche | Eingebettete DB |
**Speicherbedarf:** ~1.0-1.3 GB App + Modelle
**Mindestanforderungen:**
| Spec | Minimum | Empfohlen |
|------|---------|-----------|
| **RAM** | 8 GB | 16 GB |
| **CPU** | Intel i5 10. Gen / Apple M1 / Snapdragon 8 Gen 1 | Intel i5 12. Gen+ / Apple M2+ |
| **Speicher frei** | 5 GB | 10 GB |
| **OS** | Windows 10, macOS 12+, iPadOS 17+ | Aktuell |
**Laeuft auf:**
- Windows-Laptop 8 GB RAM (typischer Lehrer-Dienstlaptop, z.B. Lenovo L15 i5) — **~60-150 Sek/Seite Handschrift-OCR**
- MacBook Air M1+ 8 GB — **~30-60 Sek/Seite** (Neural Engine Beschleunigung)
- iPad Air M2+ (8 GB) — mit CoreML Konvertierung, **~20-40 Sek/Seite**
- iPad Pro M4+ (12-16 GB) — komfortabel
- Samsung Galaxy Tab S8/S9 (8 GB) — mit NNAPI/QNN, **~30-50 Sek/Seite**
**Laeuft NICHT auf:**
- iPad Basis (4-6 GB RAM) — iOS killt den Prozess bei TrOCR
- Budget-Android-Tablets (Galaxy Tab A8/A9, 3-4 GB RAM)
- Chromebooks mit 4 GB RAM
- Windows-Laptops mit 4 GB RAM
---
### Tier 3: Voll (16+ GB RAM / Cloud / Schul-Server)
**+ KI-Gutachten + RAG + Voice — braucht LLM.**
| Feature | Zusaetzlich zu Tier 2 |
|---------|----------------------|
| KI-Gutachten-Generierung | LLM (llama3.2 ~4 GB oder Cloud) |
| RAG / EH-Suche | Qdrant + Embedding-Service |
| Voice-Assistent | Whisper + LLM |
| KI-Worksheet-Modifikation | Vision-LLM |
**Optionen:**
| Variante | Hardware | Kosten |
|----------|---------|--------|
| **Schul-Server** | Mac Mini oder vergleichbar (Specs noch zu ermitteln) | Noch zu ermitteln |
| **Cloud** | BreakPilot Cloud-Service (gehostet) | Monatlich |
| **Lehrer-PC 16+ GB** | Lokales Ollama mit kleinen LLMs | 0 (eigene Hardware) |
!!! note "Server-Anforderungen noch offen"
Die genauen Hardware-Anforderungen fuer einen Schul-Server (RAM, CPU, Speicher) muessen im Projektverlauf durch Benchmarks ermittelt werden. Unsere Entwicklungsmaschine ist ein Mac Mini M4 Pro mit 64 GB RAM (~3.200 EUR) — das ist aber die Obergrenze, nicht die Empfehlung. Moeglicherweise reicht fuer den Schulbetrieb deutlich weniger.
---
## Typische Lehrer-Hardware in Deutschland (2024-2026)
### Digitalpakt-Kontext
- **Digitalpakt 1.0** (2019-2024): 6,5 Mrd. EUR, 97% der Mittel abgerufen
- **Digitalpakt 2.0** (2025-2030): 5 Mrd. EUR, Fokus Infrastruktur + Geraete
- Beschafft werden: Tablets, Laptops, interaktive Whiteboards, WLAN
### Was Schulen kaufen
| Geraet | Typische Specs | Preis | Verbreitung |
|--------|---------------|-------|-------------|
| **iPad (Basis)** | A16 Chip, 6 GB RAM, 64-128 GB | ~350-400 EUR | Sehr hoch |
| **iPad Air** | M2/M3 Chip, 8 GB RAM, 128-512 GB | ~520-650 EUR | Hoch |
| **Lehrer-Laptop** | Intel i5 10. Gen, 8 GB RAM, 256 GB SSD | ~400-600 EUR | Standard |
| **Samsung Galaxy Tab A** | 3-4 GB RAM, 32-128 GB | ~230-280 EUR | Gering |
| **Chromebook** | 4 GB RAM | ~250-350 EUR | Minimal (in DE) |
!!! info "iPad dominiert"
iPads sind an fast allen Schulen in Deutschland der Standard. Die meisten Schulen beschaffen iPad (Basis) oder iPad Air ueber MDM-Loesungen wie JAMF.
---
## Modell-Groessen und RAM-Bedarf
| Modell | Float32 | Int8 (quantisiert) | RAM |
|--------|---------|-------------------|-----|
| TrOCR-large Handschrift | 2.23 GB | **~560 MB** | 3-4 GB / **1-1.5 GB** |
| RapidOCR / PP-OCRv5 | ~40-90 MB | — | 200-500 MB |
| Tesseract (DE+EN) | ~30-50 MB | — | 200-300 MB |
| MiniLM Embeddings | ~90 MB | ~43 MB | 50-110 MB |
| pyspellchecker | ~5 MB | — | <10 MB |
| OpenCV (A4 300 DPI) | — | — | 200-400 MB |
| **Gesamt Offline-Kern** | **~2.6-3.0 GB** | **~1.0-1.3 GB** | **5-7 GB / 3-4.5 GB** |
!!! warning "TrOCR ist der Flaschenhals"
TrOCR-large (2.23 GB float32) **muss** als int8 ONNX quantisiert werden fuer 8 GB Geraete. Ohne Quantisierung laeuft es nur auf 16+ GB Hardware. Alternativ: TrOCR-base (~1.3 GB float32, ~330 MB int8) mit moderatem Qualitaetsverlust.
---
## ONNX Runtime: Plattform-Support
| Plattform | ONNX Runtime | Hardware-Beschleunigung |
|-----------|-------------|------------------------|
| **Windows** | Ja (nativ) | CPU, DirectML, OpenVINO |
| **macOS** | Ja (nativ) | CPU, **CoreML** (Neural Engine, 3.5x schneller) |
| **iOS** | Ja (ORT Mobile) | **CoreML** EP, XNNPACK |
| **Android** | Ja (ORT Mobile) | **NNAPI** EP, QNN EP, XNNPACK |
| **ChromeOS (Crostini)** | Ja (Linux-Binary) | Nur CPU |
| **Browser (WASM)** | Ja, aber **15-17x langsamer** als nativ | WebGPU (5x langsamer als nativ GPU) |
!!! note "Apple-Geraete am besten"
Durch CoreML + Neural Engine sind Apple-Geraete (M1+ Mac, iPad Air/Pro) die beste Consumer-Hardware fuer unsere Modelle. ~3.5x schneller als reines CPU-Inference.
---
## Distributions-Strategie
### Desktop (Primaer: Lehrer-Laptops)
| Plattform | Methode | Anmerkung |
|-----------|---------|-----------|
| **Windows** | .exe/.msi Installer von Website | Code-Signing-Zertifikat empfohlen (~300 EUR/Jahr) |
| **macOS** | .dmg von Website | Apple Notarization erforderlich (99 EUR/Jahr Developer Account) |
| **Linux** | AppImage oder .deb | Keine Signierung noetig |
**1-2 GB Installer ist fuer Desktop voellig normal** (VSCode, Slack, etc. sind aehnlich gross).
### Tablets (Sekundaer: iPads, Android)
| Plattform | Methode | Anmerkung |
|-----------|---------|-----------|
| **iOS/iPadOS** | Apple Custom Apps via Apple Business Manager + MDM | Nicht im oeffentlichen App Store, nur fuer Schulen via JAMF/Mosyle |
| **Android** | Managed Google Play (private Channel) | Fuer Schulen mit Google Workspace for Education |
**Strategie:** Kleine App (~50-100 MB Initial-Download), Modelle werden beim ersten Start nachgeladen mit Fortschrittsanzeige.
### App Store Limits
| Store | Max. Download | On-Demand Assets |
|-------|-------------|-----------------|
| **Apple App Store** | 4 GB | Bis 20 GB (On-Demand Resources) |
| **Google Play** | 200 MB (AAB) | Bis 2 GB+ (Play Asset Delivery) |
| **Microsoft Store** | 10 GB | — |
!!! info "1-2 GB App-Groesse kein Problem"
Games sind routinemaessig 2-5 GB. Fuer B2B-Education-Apps via MDM ist die Groesse kein Hindernis, da IT-Admins die Verteilung steuern.
### Warum KEIN PWA?
Progressive Web Apps sind **nicht geeignet** fuer unseren Offline-KI-Anwendungsfall:
- iOS Safari begrenzt Storage auf ~1 GB pro Origin und **kann Daten jederzeit loeschen**
- WebAssembly ONNX Runtime ist **15-17x langsamer** als native Ausfuehrung
- Kein zuverlaessiger persistenter Speicher fuer 1+ GB Modelldaten
- PWA waere akzeptabel als leichtgewichtiger Companion (Dashboard, Ergebnisse ansehen), aber nicht fuer OCR/ML-Workloads
---
## Framework-Empfehlung
| Plattform | Framework | Vorteil |
|-----------|-----------|---------|
| **Desktop** | **Tauri** (Rust + Web-Frontend) | 5-10 MB Basis (vs. 200 MB Electron), beste ML-Integration via Rust |
| **Desktop (Alternative)** | Electron | Schnellste Entwicklung wenn Team Web-fokussiert |
| **Mobile** | **Flutter** | Single Codebase iOS+Android, gute FFI fuer native ML-Libs |
| **Mobile (Alternative)** | React Native | Wenn Frontend-Team bereits React-erfahren |
!!! warning "Desktop und Mobile nicht in einer Codebase"
Die UX-Anforderungen sind zu unterschiedlich. Desktop = volle OCR-Pipeline + Korrektur-Workspace. Mobile = Scannen, Ergebnisse ansehen, Lernunits bearbeiten.
---
## Empfohlene Hardware fuer Schulen
### Minimum (Tier 2 — Handschrift-OCR offline)
> **Lehrer-Laptop:** Intel i5 (10. Gen+) oder Apple M1+, **8 GB RAM**, 256 GB SSD, Windows 10/11 oder macOS 12+
>
> **Oder iPad Air M2+** mit 128 GB Speicher
### Optimal (Tier 3 — alle Features offline)
> **Schul-Server:** Hardware-Anforderungen noch zu ermitteln.
>
> Muss LLMs lokal ausfuehren (Ollama) und als RAG-Server fuer die Schule dienen.
> Lehrer verbinden sich ueber WLAN und nutzen Tier-3-Features ueber den Server.
>
> *Referenz: Unsere Entwicklungsmaschine (Mac Mini M4 Pro, 64 GB RAM, ~3.200 EUR) laeuft komfortabel. Ob ein guenstigeres Modell (z.B. 32 GB RAM, ~1.500-2.000 EUR) ausreicht, wird im Projektverlauf durch Benchmarks geklaert.*
### Oder: BreakPilot Cloud
> Schulen ohne eigenen Server koennen Tier-3-Features ueber den BreakPilot Cloud-Service nutzen.
> Tier 1 + 2 funktionieren immer offline auf dem Endgeraet.

152
docs-src/projekt/roadmap.md Normal file
View File

@@ -0,0 +1,152 @@
# Entwicklungsroadmap
**Stand:** 2026-03-23
---
## Ueberblick
```mermaid
graph LR
P1[Phase 1<br>OCR Haerten] --> P2[Phase 2<br>Lernunits]
P1 --> P4[Phase 4<br>Korrektur]
P2 --> P3[Phase 3<br>Schuljahr]
P4 --> P5[Phase 5<br>Zeugnisse]
P5 --> P6[Phase 6<br>Onboarding]
```
Phase 2 (Lernunits) und Phase 4 (Korrektur) koennen **parallel** laufen.
---
## Phase 1: OCR-Pipeline Haerten (April 2026)
**Ziel:** OCR-Pipeline robust genug fuer alle gaengigen Schulbuch-Layouts.
| Task | Beschreibung | Aufwand |
|------|-------------|---------|
| IPA-Korrekturen | Garbled OCR-IPA in Headword-Zellen ersetzen | Klein |
| PP-DocLayout ONNX | Bessere Grafik-/Bilderkennung via ONNX-Konvertierung | Mittel |
| Page-Crop Determinismus | Spine-Shadow-Bug in `page_crop.py` fixen | Klein |
| TrOCR Finetuning | Handschrift-OCR Qualitaet mit Labeling-Daten verbessern | Gross |
| TrOCR ONNX + Int8 | Modell fuer Offline-Deployment quantisieren (~560 MB statt 2.2 GB) | Mittel |
| Ground-Truth erweitern | Regression-Test-Basis auf 10+ Sessions | Klein |
**Ergebnis:** Zuverlaessige OCR fuer gedruckte Texte + erste brauchbare Handschrift-Erkennung auf Consumer-Hardware.
---
## Phase 2: Lernunit-Generator (Mai-Juni 2026)
**Ziel:** Aus OCR-Daten automatisch Lernmodule in verschiedenen Formaten generieren.
| Task | Beschreibung | Aufwand |
|------|-------------|---------|
| Multiple-Choice-Generator | Automatisch aus extrahierten Vokabeln | Mittel |
| Lueckentext-Generator | Saetze mit Luecken aus OCR-Text | Mittel |
| Lernplakat-Generator | Druckbare Zusammenfassungen als PDF | Mittel |
| Grammatik-Test-Generator | Regelbasiert, kein LLM noetig | Gross |
| Spaced-Repetition-Engine | Leitner-System fuer Vokabel-Wiederholung | Mittel |
| Companion-App erweitern | Schueler-Player fuer alle Unit-Formate | Mittel |
**Abhaengigkeit:** Vokabel-Extraktion aus Phase 1 (existiert bereits).
**Ergebnis:** Lehrer scannt Buchseite → System generiert 5+ Lernunit-Varianten.
---
## Phase 3: Schuljahres-Begleitung (Juli-August 2026)
**Ziel:** Proaktives System das den Lehrer durch das Schuljahr fuehrt.
| Task | Beschreibung | Aufwand |
|------|-------------|---------|
| Schulkalender-Import | ICS-Format, Bundesland-spezifische Ferien | Klein |
| Phasen-Engine erweitern | State Machine fuer Schuljahres-Phasen | Mittel |
| Automatische Erinnerungen | 3 Wochen / 1 Woche vor KA via Matrix | Mittel |
| Lernunit-Versand an Eltern | Automatischer Versand via Matrix-Chat | Klein |
| Fortschritts-Dashboard | Uebersicht: Wer hat was gelernt? Wo sind Schwaechen? | Mittel |
| Eltern-View | Vereinfachte Ansicht fuer Eltern in Studio v2 | Mittel |
**Abhaengigkeit:** Lernunit-Generator aus Phase 2, Matrix-Anbindung (existiert).
**Ergebnis:** System erinnert automatisch an kommende Klassenarbeiten, verschickt Lernmaterial.
---
## Phase 4: Klausur-Korrektur Komplett (September-Oktober 2026)
**Ziel:** Vollstaendiger Korrektur-Workflow inkl. deterministische Gutachten.
| Task | Beschreibung | Aufwand |
|------|-------------|---------|
| Handschrift-OCR Integration | TrOCR in Korrektur-Workflow einbinden | Mittel |
| EH-Abgleich | Keyword-Matching gegen NiBiS-Erwartungshorizonte | Mittel |
| RS/Grammatik-Pruefung | Automatisch auf OCR-erkanntem Text | Mittel |
| Gutachten-Template-Engine | Deterministische Gutachten aus Korrekturdaten | Gross |
| Konsistenz-Check | Automatischer Abgleich ueber alle 24 Gutachten | Mittel |
| Zweitgutachter-Workflow | Visibility-Regeln, Einigung, Drittkorrektur | Mittel |
| NiBiS EH-RAG | Erwartungshorizonte in RAG ingestieren (Erweiterung der bestehenden Compliance-RAG-Pipeline) | Mittel |
**Abhaengigkeit:** Handschrift-OCR aus Phase 1, RAG-Pipeline (existiert fuer Compliance, muss fuer NiBiS erweitert werden).
**Ergebnis:** Lehrer scannt Klausur → System liefert RS/Grammatik-Fehler + EH-Abgleich + Gutachten-Entwurf.
---
## Phase 5: Zeugnis-Generator (November-Dezember 2026)
**Ziel:** Zeugnisse aus gesammelten Jahresdaten generieren.
| Task | Beschreibung | Aufwand |
|------|-------------|---------|
| Zeugnis-Templates | Pro Schulform/Jahrgang fuer Niedersachsen | Gross |
| Daten-Aggregation | Alle Noten, Kompetenzen, Fehlzeiten zusammenfuehren | Mittel |
| Textbaustein-System | Deterministische Formulierungen aus Datenpunkten | Mittel |
| PDF-Export | Schulform-konforme Zeugnisse als PDF | Mittel |
| Bundesland-Konfiguration | Start Niedersachsen, erweiterbar auf andere | Klein |
**Abhaengigkeit:** Notenspiegel (existiert), Daten aus dem gesamten Schuljahr.
**Ergebnis:** Ein-Klick-Zeugniserstellung aus allen gesammelten Daten.
---
## Phase 6: Lehrer-Onboarding + Polish (Q1 2027)
**Ziel:** Lehrer koennen mitten im Schuljahr einsteigen.
| Task | Beschreibung | Aufwand |
|------|-------------|---------|
| Notizbuch-OCR | Handschriftliche Notizbuecher → Klassen/Schueler anlegen | Gross |
| Status-Erkennung | System erkennt wo im Schuljahr der Lehrer steht | Mittel |
| Guided Onboarding Wizard | Schritt-fuer-Schritt Einrichtung | Mittel |
| Differenzierung | 3 Niveaus (Basis/Standard/Erweitert) fuer Lernunits | Mittel |
| Export-Formate | IMS QTI, CSV/Excel fuer Interoperabilitaet | Klein |
| Kollaborations-Features | Materialpool fuer Fachschaften | Gross |
---
## Offline vs Cloud pro Phase
| Phase | Offline (deterministisch) | Cloud/LLM (optional) |
|-------|--------------------------|---------------------|
| 1 OCR Haerten | Tesseract, RapidOCR, TrOCR, OpenCV | qwen2.5vl fuer HTR |
| 2 Lernunits | Templates, Algorithmen, Spaced Repetition | KI-Varianten |
| 3 Schuljahres-Begleitung | State-Engine, Kalender, Erinnerungen | — |
| 4 Korrektur Komplett | RS/Grammatik, Keyword-Match, Templates | KI-Gutachten, RAG |
| 5 Zeugnisse | Templates, Daten-Aggregation | KI-Textverbesserung |
| 6 Onboarding | TrOCR, Wizard, Export | — |
---
## Meilensteine
| Datum | Meilenstein |
|-------|------------|
| **April 2026** | OCR-Pipeline stabil, TrOCR quantisiert und offline-faehig |
| **Juni 2026** | Lernunit-Generator mit 5+ Formaten, Companion-Player fuer Schueler |
| **August 2026** | Schuljahres-Begleitung aktiv, automatischer Lernunit-Versand an Eltern |
| **Oktober 2026** | Klausur-Korrektur End-to-End: Scan → Gutachten (deterministisch) |
| **Dezember 2026** | Zeugnis-Generator fuer Niedersachsen produktiv |
| **Maerz 2027** | Lehrer-Onboarding aus handschriftlichen Notizbuechern, Kollaboration |

View File

@@ -0,0 +1,191 @@
# BreakPilot Lehrer — Vision, Mission & Projektuebersicht
## Vision
**Jeder Lehrer in Deutschland hat einen digitalen Assistenten, der repetitive Verwaltungsarbeit uebernimmt — offline, datenschutzkonform und auf jeder Hardware.**
BreakPilot Lehrer befreit Lehrkraefte von Buerokratie, damit sie sich auf das konzentrieren koennen, wofuer sie Lehrer geworden sind: Unterrichten.
---
## Mission
Wir entwickeln eine **Offline-First Desktop- und Tablet-App**, die Lehrer proaktiv durch das Schuljahr begleitet. Die App erkennt handschriftliche und gedruckte Dokumente, automatisiert Korrektur-Workflows, generiert Lernmaterial und erstellt Zeugnisse — alles deterministisch, ohne Cloud-Abhaengigkeit und DSGVO-konform.
**Unsere drei Prinzipien:**
1. **Offline First** — Alle Kernfunktionen laufen ohne Internet, ohne GPU, auf normaler Lehrer-Hardware
2. **Deterministisch vor KI** — Jede Funktion wird zuerst regelbasiert implementiert. LLM ist optionales Upgrade, nie Kernabhaengigkeit
3. **Datenschutz by Design** — Alle Schuelerdaten bleiben lokal auf dem Geraet des Lehrers. Keine Cloud-Speicherung personenbezogener Daten
---
## Das Problem
### Korrektur: 6 Stunden pro Schueler
Eine Deutsch-Abiturarbeit erfordert im Durchschnitt **6 Stunden Korrekturzeit pro Schueler**. Bei 24 Schuelern sitzt ein Lehrer **zwei Wochen** ausschliesslich an der Korrektur. Der Prozess ist streng reglementiert:
1. Rechtschreibfehler markieren (Durchgang 1)
2. Grammatikfehler markieren (Durchgang 2)
3. Inhalt gegen den offiziellen Erwartungshorizont (EH) bewerten (Durchgang 3)
4. Notenspiegel ueber alle Schueler erstellen
5. Gutachten pro Schueler schreiben
6. Alle 24 Gutachten aufeinander abstimmen (Konsistenz)
7. Zweitgutachter bewertet unabhaengig
8. Bei >= 4 Punkte Differenz: Drittkorrektur
### Verwaltung: Fragmentierte Werkzeuge
Lehrer jonglieren zwischen handschriftlichen Notizbuechern, Excel-Tabellen, Word-Dokumenten und verschiedenen Schulportalen. Es gibt kein einheitliches System, das den Schuljahres-Rhythmus kennt und vorausschauend die richtigen Werkzeuge aktiviert.
---
## Die Loesung: BreakPilot Lehrer
### Fuer Lehrer (primaere Zielgruppe)
| Funktion | Was es tut | Offline? |
|----------|-----------|----------|
| **Klausur-Korrektur** | Scan → OCR → RS/Grammatik-Pruefung → EH-Abgleich → Notenspiegel → Gutachten | Ja |
| **Vokabel-Arbeitsblaetter** | Buchseite scannen → Vokabeln extrahieren → 5+ Arbeitsblatt-Formate generieren | Ja |
| **Lernunit-Generator** | Aus OCR-Daten Multiple-Choice, Lueckentexte, Lernplakate erstellen | Ja |
| **Zeugnis-Generator** | Template-basierte Zeugnisse aus gesammelten Jahresdaten | Ja |
| **Notenspiegel** | Automatische Berechnung + Fairness-Analyse + Ausreisser-Erkennung | Ja |
| **Schuljahres-Planer** | Proaktive Aufgabensteuerung basierend auf Schulkalender | Ja |
### Fuer Eltern (sekundaere Zielgruppe)
- Erhalten automatisch generierte Lernmodule via Chat (Matrix)
- Waehlen passende Uebungen fuer ihr Kind aus
- Begleiten den Lernfortschritt mit Spaced-Repetition
### Fuer Schueler (Endnutzer)
- Lernen in automatisch generierten Modulen (Vokabeln, Grammatik, Multiple Choice)
- Fortschritt wird getrackt, Schwaechen erkannt
- Erinnerungen vor Klassenarbeiten
---
## Automatischer Workflow (Beispiel)
```
Trigger: "In 3 Wochen Englisch-Klassenarbeit, Unit 4"
1. Lehrer scannt Buchseiten 54-58 ein
|
2. OCR-Pipeline extrahiert Text, Vokabeln, Grammatik
|
3. System generiert automatisch:
- Multiple-Choice-Test
- Deutsch → Englisch Vokabelabfrage
- Englisch → Deutsch Vokabelabfrage
- Lueckentexte
- Lernplakat (druckbar)
- Grammatiktests
|
4. Lernunits gehen an Eltern via Chat
"Englisch Unit 4 — 5 Lernmodule verfuegbar"
|
5. Eltern waehlen passende Units fuer ihr Kind
|
6. Kind lernt in der App, Fortschritt wird getrackt
|
7. Automatische Erinnerungen bis zur Klassenarbeit
"Noch 5 Tage — 12 von 45 Vokabeln gelernt"
```
---
## Schuljahres-Begleitung
Das System kennt den Schuljahresrhythmus und aktiviert proaktiv die passenden Funktionen:
| Phase | System-Aktion |
|-------|---------------|
| **Schulbeginn** | Klassen einrichten, Schueler anlegen, Onboarding |
| **Unterrichtsphase** | Lernmaterial vorbereiten, Units aus Buchseiten erstellen |
| **3 Wochen vor Klassenarbeit** | Lernunits automatisch generieren + an Eltern senden |
| **1 Woche vor Klassenarbeit** | Erinnerungen, Fortschritt pruefen |
| **Klassenarbeit geschrieben** | Korrektur-Workflow aktivieren |
| **Nach Korrektur** | Notenspiegel erstellen, Gutachten generieren |
| **Konferenzen** | Berichte aggregieren und vorbereiten |
| **Zeugniszeit** | Zeugnis-Generator mit allen gesammelten Daten |
| **Ferien** | Wiederholungsmaterial, naechstes Halbjahr vorbereiten |
---
## Technologie
### Offline-Kern (~1.3 GB quantisiert)
| Komponente | Technologie | Groesse |
|------------|-------------|---------|
| OCR (gedruckt) | Tesseract + RapidOCR (ONNX) | ~70 MB |
| OCR (Handschrift) | TrOCR (ONNX, int8 quantisiert) | ~560 MB |
| Layout-/Grafik-Erkennung | OpenCV | 0 |
| Rechtschreibung | pyspellchecker EN+DE | ~5 MB |
| Text-Embeddings | all-MiniLM-L6-v2 | ~90 MB |
| App + Logik | Python/TypeScript | ~200 MB |
### Optionale Cloud-Features
| Feature | Wofuer | Abhaengigkeit |
|---------|--------|---------------|
| KI-Gutachten | Gutachten-Vorschlaege aus Korrekturdaten | LLM (Cloud/GPU) |
| RAG / EH-Suche | Erwartungshorizont semantisch durchsuchen | Qdrant + Embedding |
| Spracheingabe | Aufgaben per Freitext einsprechen | Whisper |
| KI-Worksheet-Modifikation | Lernmaterial KI-optimiert anpassen | LLM |
---
## Datenschutz (DSGVO)
- **Alle Schuelerdaten, Noten und Klausuren bleiben lokal** auf dem Geraet des Lehrers
- Keine Cloud-Speicherung personenbezogener Daten
- Cloud-Features (wenn aktiviert) verarbeiten nur anonymisierte Daten
- Kommunikation ueber Matrix (Ende-zu-Ende-verschluesselt)
- Keine Audioaufnahmen gespeichert (Voice-Service)
---
## Bundesland-Erweiterbarkeit
Start mit **Niedersachsen** als Pilotbundesland. Die Architektur erlaubt spaetere Erweiterung auf andere Bundeslaender mit eigenen:
- Erwartungshorizonten und Pruefungsformaten
- Notensystemen (15-Punkte vs. Noten 1-6)
- Zeugnisvorlagen und Verwaltungsvorschriften
- Schulformen und Jahrgangsstufen
---
## Aktueller Stand (Maerz 2026)
| Modul | Status |
|-------|--------|
| OCR-Pipeline (gedruckt) | 85% — Tesseract + RapidOCR + PaddleOCR, 10-Step Pipeline |
| Vokabel-Arbeitsblaetter | 90% — 4 Formate + NRU, PDF-Export |
| Klausur-Korrektur | 70% — Scan, Annotation, 5-Kriterien, Gutachten, Fairness |
| Notenspiegel | 85% — 15-Punkte, Histogramm, Ausreisser |
| Admin Dashboard | 85% — 12 Sektionen, AI-Tools, SBOM, Security |
| Studio v2 (Lehrer-UI) | 80% — 12+ Apps, 7 Sprachen, Dark/Light Mode |
| RAG / EH-Suche | 80% — Qdrant + Embedding + Hybrid Search |
| Voice-Service | 60% — WebSocket, Whisper, Intent-Router |
| Messaging | 75% — Matrix/Synapse integriert |
| Video | 70% — Jitsi integriert |
| Handschrift-OCR | 40% — TrOCR integriert, Qualitaet verbessern |
| Lernunit-Generator | 25% — Backend-API + Companion UI vorhanden |
| Zeugnis-Generator | 30% — API + Models vorhanden |
| Schuljahres-Planer | 15% — State-Engine API vorhanden |
---
## Kontakt
**BreakPilot** — KI-Bildungsplattform fuer den deutschen Schulalltag
- Pilotphase: Niedersachsen
- Hardware: Offline auf jedem Laptop mit 8 GB RAM
- Datenschutz: DSGVO-konform, alle Daten lokal

View File

@@ -55,6 +55,10 @@ markdown_extensions:
nav: nav:
- Start: index.md - Start: index.md
- Projekt:
- Vision & Mission: projekt/vision-und-mission.md
- Roadmap: projekt/roadmap.md
- Hardware & Distribution: projekt/hardware-und-distribution.md
- Services: - Services:
- KI-Daten-Pipeline: - KI-Daten-Pipeline:
- Uebersicht: services/ki-daten-pipeline/index.md - Uebersicht: services/ki-daten-pipeline/index.md