feat: OCR word_boxes fuer pixelgenaue Overlay-Positionierung

Backend: _ocr_cell_crop speichert jetzt word_boxes mit exakten Tesseract/RapidOCR Wort-Koordinaten (left, top, width, height) im Cell-Ergebnis. Absolute Bildkoordinaten, bereits zurueckgemappt. Frontend: Slide-Hook nutzt word_boxes direkt wenn vorhanden — jedes Wort wird exakt an seiner OCR-Position platziert. Kein Pixel-Scanning noetig. Fallback auf alten Slide wenn keine Boxes. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-11 19:39:49 +01:00
parent 4949863bd7
commit 0ee92e7210
4 changed files with 80 additions and 18 deletions
@@ -16,6 +16,7 @@ export type {
  RowItem,
  GridResult,
  GridCell,
+  OcrWordBox,
  WordBbox,
  ColumnMeta,
 } from '../ocr-pipeline/types'
@@ -220,6 +220,15 @@ export interface WordBbox {
  h: number
 }

+export interface OcrWordBox {
+  text: string
+  left: number    // absolute image x in px
+  top: number     // absolute image y in px
+  width: number   // px
+  height: number  // px
+  conf: number
+}
+
 export interface GridCell {
  cell_id: string          // "R03_C1"
  row_index: number
@@ -232,6 +241,7 @@ export interface GridCell {
  ocr_engine?: string
  is_bold?: boolean
  status?: 'pending' | 'confirmed' | 'edited' | 'skipped'
+  word_boxes?: OcrWordBox[]  // per-word bounding boxes from OCR engine
 }

 export interface ColumnMeta {