This repository has been archived on 2026-02-15 . You can view files and clone it. You cannot open issues or pull requests or push a commit.
945b955b54f4fd5b476240133a53c5f6c2dad578
Begradigt schiefe Scans vor der OCR-Extraktion anhand der linksbuendigen
Wortanfaenge der Vokabelspalte. Tesseract liefert achsenparallele Boxen,
die bei ~2-3 Grad Schraege in Nachbarzeilen bluten — der Deskew behebt das.
- Neue Funktion deskew_image_by_word_alignment() in cv_vocab_pipeline.py
- Deskew-Integration im extract-with-boxes Endpoint (vor OCR)
- Neuer GET Endpoint /deskewed-image/{page} fuer begradigtes Seitenbild
- Frontend: GroundTruthPanel wechselt nach Extraktion auf deskewed Image
- ~1s Overhead durch schnellen Tesseract-Pass auf halbiertem Bild
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
Description
ARCHIVIERT - Migriert nach breakpilot-core, breakpilot-lehrer, breakpilot-compliance
Languages
TypeScript
47.5%
Python
34.1%
Go
12.5%
JavaScript
2.4%
HTML
1.3%
Other
1.9%