feat(ocr-pipeline): add SSE streaming and phonetic filter to LLM review

- Stream LLM review results batch-by-batch (8 entries per batch) via SSE - Frontend shows live progress bar, batch log, and corrections appearing - Skip entries with IPA phonetic transcriptions (already dictionary-corrected) - Refactor llm_review_entries into reusable helpers for both streaming and non-streaming paths Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-02 11:46:06 +01:00
parent e171a736e7
commit 2a493890b6
3 changed files with 441 additions and 193 deletions
@@ -1,6 +1,6 @@
 'use client'

-import { useCallback, useState } from 'react'
+import { useCallback, useRef, useState } from 'react'

 const KLAUSUR_API = '/klausur-api'

@@ -11,19 +11,23 @@ interface LlmChange {
  new: string
 }

-interface LlmReviewResult {
-  changes: LlmChange[]
-  model_used: string
-  duration_ms: number
-  total_entries: number
-  corrections_found: number
-}
-
 interface StepLlmReviewProps {
  sessionId: string | null
  onNext: () => void
 }

+interface ReviewMeta {
+  total_entries: number
+  to_review: number
+  skipped: number
+  model: string
+}
+
+interface StreamProgress {
+  current: number
+  total: number
+}
+
 const FIELD_LABELS: Record<string, string> = {
  english: 'EN',
  german: 'DE',
@@ -32,34 +36,96 @@ const FIELD_LABELS: Record<string, string> = {

 export function StepLlmReview({ sessionId, onNext }: StepLlmReviewProps) {
  const [status, setStatus] = useState<'idle' | 'running' | 'done' | 'error' | 'applied'>('idle')
-  const [result, setResult] = useState<LlmReviewResult | null>(null)
-  const [error, setError] = useState<string>('')
+  const [meta, setMeta] = useState<ReviewMeta | null>(null)
+  const [changes, setChanges] = useState<LlmChange[]>([])
+  const [progress, setProgress] = useState<StreamProgress | null>(null)
+  const [batchLog, setBatchLog] = useState<string[]>([])
+  const [totalDuration, setTotalDuration] = useState(0)
+  const [error, setError] = useState('')
  const [accepted, setAccepted] = useState<Set<number>>(new Set())
  const [applying, setApplying] = useState(false)
+  const tableEndRef = useRef<HTMLDivElement>(null)

  const runReview = useCallback(async () => {
    if (!sessionId) return
    setStatus('running')
    setError('')
-    setResult(null)
+    setChanges([])
+    setBatchLog([])
+    setProgress(null)
+    setMeta(null)
+    setTotalDuration(0)

    try {
-      const res = await fetch(`${KLAUSUR_API}/api/v1/ocr-pipeline/sessions/${sessionId}/llm-review`, {
-        method: 'POST',
-        headers: { 'Content-Type': 'application/json' },
-        body: JSON.stringify({}),
-      })
+      const res = await fetch(
+        `${KLAUSUR_API}/api/v1/ocr-pipeline/sessions/${sessionId}/llm-review?stream=true`,
+        { method: 'POST', headers: { 'Content-Type': 'application/json' }, body: JSON.stringify({}) },
+      )

      if (!res.ok) {
        const data = await res.json().catch(() => ({}))
        throw new Error(data.detail || `HTTP ${res.status}`)
      }

-      const data: LlmReviewResult = await res.json()
-      setResult(data)
-      // Accept all changes by default
-      setAccepted(new Set(data.changes.map((_, i) => i)))
-      setStatus('done')
+      const reader = res.body!.getReader()
+      const decoder = new TextDecoder()
+      let buffer = ''
+      let allChanges: LlmChange[] = []
+
+      while (true) {
+        const { done, value } = await reader.read()
+        if (done) break
+        buffer += decoder.decode(value, { stream: true })
+
+        while (buffer.includes('\n\n')) {
+          const idx = buffer.indexOf('\n\n')
+          const chunk = buffer.slice(0, idx).trim()
+          buffer = buffer.slice(idx + 2)
+
+          if (!chunk.startsWith('data: ')) continue
+          const dataStr = chunk.slice(6)
+
+          let event: any
+          try { event = JSON.parse(dataStr) } catch { continue }
+
+          if (event.type === 'meta') {
+            setMeta({
+              total_entries: event.total_entries,
+              to_review: event.to_review,
+              skipped: event.skipped,
+              model: event.model,
+            })
+            setBatchLog([`${event.total_entries} Eintraege, ${event.skipped} uebersprungen (Lautschrift), ${event.to_review} zu pruefen`])
+          }
+
+          if (event.type === 'batch') {
+            const batchChanges: LlmChange[] = event.changes || []
+            allChanges = [...allChanges, ...batchChanges]
+            setChanges(allChanges)
+            setProgress(event.progress)
+            const rows = (event.entries_reviewed || []).map((r: number) => `R${r}`).join(', ')
+            setBatchLog(prev => [...prev,
+              `Batch ${event.batch_index + 1}: ${rows} — ${batchChanges.length} Korrektur${batchChanges.length !== 1 ? 'en' : ''} (${event.duration_ms}ms)`
+            ])
+            setTimeout(() => tableEndRef.current?.scrollIntoView({ behavior: 'smooth', block: 'nearest' }), 16)
+          }
+
+          if (event.type === 'complete') {
+            setTotalDuration(event.duration_ms)
+            setAccepted(new Set(allChanges.map((_, i) => i)))
+            setStatus('done')
+          }
+
+          if (event.type === 'error') {
+            throw new Error(event.detail || 'Unbekannter Fehler')
+          }
+        }
+      }
+
+      // If no complete event was received (e.g. 0 entries to review)
+      if (allChanges.length === 0 && status !== 'done') {
+        setStatus('done')
+      }
    } catch (e: unknown) {
      const msg = e instanceof Error ? e.message : String(e)
      setError(msg)
@@ -68,7 +134,7 @@ export function StepLlmReview({ sessionId, onNext }: StepLlmReviewProps) {
  }, [sessionId])

  const toggleChange = (index: number) => {
-    setAccepted((prev) => {
+    setAccepted(prev => {
      const next = new Set(prev)
      if (next.has(index)) next.delete(index)
      else next.add(index)
@@ -77,48 +143,39 @@ export function StepLlmReview({ sessionId, onNext }: StepLlmReviewProps) {
  }

  const toggleAll = () => {
-    if (!result) return
-    if (accepted.size === result.changes.length) {
+    if (accepted.size === changes.length) {
      setAccepted(new Set())
    } else {
-      setAccepted(new Set(result.changes.map((_, i) => i)))
+      setAccepted(new Set(changes.map((_, i) => i)))
    }
  }

  const applyChanges = useCallback(async () => {
-    if (!sessionId || !result) return
+    if (!sessionId) return
    setApplying(true)
-
    try {
      const res = await fetch(`${KLAUSUR_API}/api/v1/ocr-pipeline/sessions/${sessionId}/llm-review/apply`, {
        method: 'POST',
        headers: { 'Content-Type': 'application/json' },
        body: JSON.stringify({ accepted_indices: Array.from(accepted) }),
      })
-
      if (!res.ok) {
        const data = await res.json().catch(() => ({}))
        throw new Error(data.detail || `HTTP ${res.status}`)
      }
-
      setStatus('applied')
    } catch (e: unknown) {
-      const msg = e instanceof Error ? e.message : String(e)
-      setError(msg)
+      setError(e instanceof Error ? e.message : String(e))
    } finally {
      setApplying(false)
    }
-  }, [sessionId, result, accepted])
+  }, [sessionId, accepted])

  if (!sessionId) {
-    return (
-      <div className="text-center py-12 text-gray-400">
-        Bitte zuerst eine Session auswaehlen.
-      </div>
-    )
+    return <div className="text-center py-12 text-gray-400">Bitte zuerst eine Session auswaehlen.</div>
  }

-  // --- Idle state ---
+  // --- Idle ---
  if (status === 'idle') {
    return (
      <div className="flex flex-col items-center justify-center py-12 text-center">
@@ -127,59 +184,104 @@ export function StepLlmReview({ sessionId, onNext }: StepLlmReviewProps) {
          Schritt 6: LLM-Korrektur
        </h3>
        <p className="text-gray-500 dark:text-gray-400 max-w-lg mb-2">
-          Ein lokales Sprachmodell prueft die OCR-Ergebnisse auf typische Erkennungsfehler
-          (z.B. &quot;8en&quot; statt &quot;Ben&quot;) und schlaegt Korrekturen vor.
+          Ein lokales Sprachmodell prueft die OCR-Ergebnisse auf typische Erkennungsfehler.
+          Eintraege mit Lautschrift werden automatisch uebersprungen.
        </p>
        <p className="text-xs text-gray-400 dark:text-gray-500 mb-6">
          Modell: <span className="font-mono">qwen3:30b-a3b</span> via Ollama (lokal)
        </p>
-        <button
-          onClick={runReview}
-          className="px-6 py-2.5 bg-teal-600 text-white rounded-lg hover:bg-teal-700 transition-colors font-medium"
-        >
+        <button onClick={runReview}
+          className="px-6 py-2.5 bg-teal-600 text-white rounded-lg hover:bg-teal-700 transition-colors font-medium">
          LLM-Korrektur starten
        </button>
      </div>
    )
  }

-  // --- Running state ---
+  // --- Running (with live progress) ---
  if (status === 'running') {
+    const pct = progress ? Math.round((progress.current / progress.total) * 100) : 0
+
    return (
-      <div className="flex flex-col items-center justify-center py-16 text-center">
-        <div className="animate-spin rounded-full h-10 w-10 border-b-2 border-teal-500 mb-4" />
-        <h3 className="text-lg font-medium text-gray-700 dark:text-gray-300 mb-1">
-          Korrektur laeuft...
-        </h3>
-        <p className="text-sm text-gray-400">
-          <span className="font-mono">qwen3:30b-a3b</span> prueft die Vokabeleintraege
-        </p>
+      <div className="space-y-4">
+        <div className="flex items-center gap-3">
+          <div className="animate-spin rounded-full h-5 w-5 border-b-2 border-teal-500" />
+          <h3 className="text-base font-medium text-gray-700 dark:text-gray-300">
+            LLM-Korrektur laeuft...
+          </h3>
+          {meta && (
+            <span className="text-xs text-gray-400 font-mono">{meta.model}</span>
+          )}
+        </div>
+
+        {/* Progress bar */}
+        {progress && (
+          <div className="space-y-1">
+            <div className="flex justify-between text-xs text-gray-400">
+              <span>{progress.current} / {progress.total} Eintraege geprueft</span>
+              <span>{pct}%</span>
+            </div>
+            <div className="w-full bg-gray-200 dark:bg-gray-700 rounded-full h-2">
+              <div className="bg-teal-500 h-2 rounded-full transition-all duration-500" style={{ width: `${pct}%` }} />
+            </div>
+          </div>
+        )}
+
+        {/* Live batch log */}
+        <div className="bg-gray-50 dark:bg-gray-800/50 rounded-lg p-3 max-h-40 overflow-y-auto">
+          {batchLog.map((line, i) => (
+            <div key={i} className="text-xs text-gray-500 dark:text-gray-400 font-mono py-0.5">{line}</div>
+          ))}
+        </div>
+
+        {/* Live changes appearing */}
+        {changes.length > 0 && (
+          <div className="border border-gray-200 dark:border-gray-700 rounded-lg overflow-hidden">
+            <table className="w-full text-sm">
+              <thead>
+                <tr className="bg-gray-50 dark:bg-gray-800 border-b border-gray-200 dark:border-gray-700">
+                  <th className="px-3 py-2 text-left text-gray-500 dark:text-gray-400 font-medium">Zeile</th>
+                  <th className="px-3 py-2 text-left text-gray-500 dark:text-gray-400 font-medium">Feld</th>
+                  <th className="px-3 py-2 text-left text-gray-500 dark:text-gray-400 font-medium">Vorher</th>
+                  <th className="px-3 py-2 text-left text-gray-500 dark:text-gray-400 font-medium">Nachher</th>
+                </tr>
+              </thead>
+              <tbody>
+                {changes.map((change, idx) => (
+                  <tr key={idx} className="border-b border-gray-100 dark:border-gray-700/50 bg-teal-50/50 dark:bg-teal-900/10">
+                    <td className="px-3 py-1.5 text-gray-500 dark:text-gray-400 font-mono text-xs">R{change.row_index}</td>
+                    <td className="px-3 py-1.5">
+                      <span className="text-xs px-1.5 py-0.5 rounded bg-gray-100 dark:bg-gray-700 text-gray-600 dark:text-gray-400">
+                        {FIELD_LABELS[change.field] || change.field}
+                      </span>
+                    </td>
+                    <td className="px-3 py-1.5"><span className="line-through text-red-500 dark:text-red-400">{change.old}</span></td>
+                    <td className="px-3 py-1.5"><span className="text-green-600 dark:text-green-400 font-medium">{change.new}</span></td>
+                  </tr>
+                ))}
+              </tbody>
+            </table>
+            <div ref={tableEndRef} />
+          </div>
+        )}
      </div>
    )
  }

-  // --- Error state ---
+  // --- Error ---
  if (status === 'error') {
    return (
      <div className="flex flex-col items-center justify-center py-12 text-center">
        <div className="text-5xl mb-4">⚠️</div>
-        <h3 className="text-lg font-medium text-red-600 dark:text-red-400 mb-2">
-          Fehler bei LLM-Korrektur
-        </h3>
-        <p className="text-sm text-gray-500 dark:text-gray-400 max-w-lg mb-4">
-          {error}
-        </p>
+        <h3 className="text-lg font-medium text-red-600 dark:text-red-400 mb-2">Fehler bei LLM-Korrektur</h3>
+        <p className="text-sm text-gray-500 dark:text-gray-400 max-w-lg mb-4">{error}</p>
        <div className="flex gap-3">
-          <button
-            onClick={runReview}
-            className="px-5 py-2 bg-teal-600 text-white rounded-lg hover:bg-teal-700 transition-colors text-sm"
-          >
+          <button onClick={runReview}
+            className="px-5 py-2 bg-teal-600 text-white rounded-lg hover:bg-teal-700 transition-colors text-sm">
            Erneut versuchen
          </button>
-          <button
-            onClick={onNext}
-            className="px-5 py-2 bg-gray-200 dark:bg-gray-700 text-gray-700 dark:text-gray-300 rounded-lg hover:bg-gray-300 dark:hover:bg-gray-600 transition-colors text-sm"
-          >
+          <button onClick={onNext}
+            className="px-5 py-2 bg-gray-200 dark:bg-gray-700 text-gray-700 dark:text-gray-300 rounded-lg hover:bg-gray-300 dark:hover:bg-gray-600 transition-colors text-sm">
            Ueberspringen →
          </button>
        </div>
@@ -187,48 +289,37 @@ export function StepLlmReview({ sessionId, onNext }: StepLlmReviewProps) {
    )
  }

-  // --- Applied state ---
+  // --- Applied ---
  if (status === 'applied') {
    return (
      <div className="flex flex-col items-center justify-center py-12 text-center">
        <div className="text-5xl mb-4">✅</div>
-        <h3 className="text-lg font-medium text-gray-700 dark:text-gray-300 mb-2">
-          Korrekturen uebernommen
-        </h3>
+        <h3 className="text-lg font-medium text-gray-700 dark:text-gray-300 mb-2">Korrekturen uebernommen</h3>
        <p className="text-sm text-gray-500 dark:text-gray-400 mb-6">
-          {accepted.size} von {result?.changes.length ?? 0} Korrekturen wurden angewendet.
+          {accepted.size} von {changes.length} Korrekturen wurden angewendet.
        </p>
-        <button
-          onClick={onNext}
-          className="px-6 py-2.5 bg-teal-600 text-white rounded-lg hover:bg-teal-700 transition-colors font-medium"
-        >
+        <button onClick={onNext}
+          className="px-6 py-2.5 bg-teal-600 text-white rounded-lg hover:bg-teal-700 transition-colors font-medium">
          Weiter →
        </button>
      </div>
    )
  }

-  // --- Done state: show diff table ---
-  const changes = result?.changes ?? []
-
+  // --- Done: diff table with checkboxes ---
  if (changes.length === 0) {
    return (
      <div className="flex flex-col items-center justify-center py-12 text-center">
        <div className="text-5xl mb-4">👍</div>
-        <h3 className="text-lg font-medium text-gray-700 dark:text-gray-300 mb-2">
-          Keine Korrekturen noetig
-        </h3>
-        <p className="text-sm text-gray-500 dark:text-gray-400 mb-1">
-          Das LLM hat keine OCR-Fehler gefunden.
-        </p>
-        <p className="text-xs text-gray-400 dark:text-gray-500 mb-6">
-          {result?.total_entries} Eintraege geprueft in {result?.duration_ms}ms
-          ({result?.model_used})
-        </p>
-        <button
-          onClick={onNext}
-          className="px-6 py-2.5 bg-teal-600 text-white rounded-lg hover:bg-teal-700 transition-colors font-medium"
-        >
+        <h3 className="text-lg font-medium text-gray-700 dark:text-gray-300 mb-2">Keine Korrekturen noetig</h3>
+        <p className="text-sm text-gray-500 dark:text-gray-400 mb-1">Das LLM hat keine OCR-Fehler gefunden.</p>
+        {meta && (
+          <p className="text-xs text-gray-400 dark:text-gray-500 mb-6">
+            {meta.to_review} geprueft, {meta.skipped} uebersprungen · {totalDuration}ms · {meta.model}
+          </p>
+        )}
+        <button onClick={onNext}
+          className="px-6 py-2.5 bg-teal-600 text-white rounded-lg hover:bg-teal-700 transition-colors font-medium">
          Weiter →
        </button>
      </div>
@@ -240,22 +331,17 @@ export function StepLlmReview({ sessionId, onNext }: StepLlmReviewProps) {
      {/* Header */}
      <div className="flex items-center justify-between">
        <div>
-          <h3 className="text-base font-medium text-gray-700 dark:text-gray-300">
-            LLM-Korrekturvorschlaege
-          </h3>
+          <h3 className="text-base font-medium text-gray-700 dark:text-gray-300">LLM-Korrekturvorschlaege</h3>
          <p className="text-xs text-gray-400 mt-0.5">
            {changes.length} Korrektur{changes.length !== 1 ? 'en' : ''} gefunden
-            · {result?.duration_ms}ms · {result?.model_used}
+            {meta && <> · {meta.skipped} uebersprungen (Lautschrift)</>}
+            {' '}· {totalDuration}ms · {meta?.model}
          </p>
        </div>
-        <div className="flex items-center gap-2">
-          <button
-            onClick={toggleAll}
-            className="text-xs px-3 py-1.5 border border-gray-300 dark:border-gray-600 rounded-lg hover:bg-gray-50 dark:hover:bg-gray-700 transition-colors text-gray-600 dark:text-gray-400"
-          >
-            {accepted.size === changes.length ? 'Keine' : 'Alle'} auswaehlen
-          </button>
-        </div>
+        <button onClick={toggleAll}
+          className="text-xs px-3 py-1.5 border border-gray-300 dark:border-gray-600 rounded-lg hover:bg-gray-50 dark:hover:bg-gray-700 transition-colors text-gray-600 dark:text-gray-400">
+          {accepted.size === changes.length ? 'Keine' : 'Alle'} auswaehlen
+        </button>
      </div>

      {/* Diff table */}
@@ -264,12 +350,8 @@ export function StepLlmReview({ sessionId, onNext }: StepLlmReviewProps) {
          <thead>
            <tr className="bg-gray-50 dark:bg-gray-800 border-b border-gray-200 dark:border-gray-700">
              <th className="w-10 px-3 py-2 text-center">
-                <input
-                  type="checkbox"
-                  checked={accepted.size === changes.length}
-                  onChange={toggleAll}
-                  className="rounded border-gray-300 dark:border-gray-600"
-                />
+                <input type="checkbox" checked={accepted.size === changes.length} onChange={toggleAll}
+                  className="rounded border-gray-300 dark:border-gray-600" />
              </th>
              <th className="px-3 py-2 text-left text-gray-500 dark:text-gray-400 font-medium">Zeile</th>
              <th className="px-3 py-2 text-left text-gray-500 dark:text-gray-400 font-medium">Feld</th>
@@ -279,40 +361,21 @@ export function StepLlmReview({ sessionId, onNext }: StepLlmReviewProps) {
          </thead>
          <tbody>
            {changes.map((change, idx) => (
-              <tr
-                key={idx}
-                className={`border-b border-gray-100 dark:border-gray-700/50 ${
-                  accepted.has(idx)
-                    ? 'bg-teal-50/50 dark:bg-teal-900/10'
-                    : 'bg-white dark:bg-gray-800/50'
-                }`}
-              >
+              <tr key={idx} className={`border-b border-gray-100 dark:border-gray-700/50 ${
+                accepted.has(idx) ? 'bg-teal-50/50 dark:bg-teal-900/10' : 'bg-white dark:bg-gray-800/50'
+              }`}>
                <td className="px-3 py-2 text-center">
-                  <input
-                    type="checkbox"
-                    checked={accepted.has(idx)}
-                    onChange={() => toggleChange(idx)}
-                    className="rounded border-gray-300 dark:border-gray-600"
-                  />
-                </td>
-                <td className="px-3 py-2 text-gray-500 dark:text-gray-400 font-mono text-xs">
-                  R{change.row_index}
+                  <input type="checkbox" checked={accepted.has(idx)} onChange={() => toggleChange(idx)}
+                    className="rounded border-gray-300 dark:border-gray-600" />
                </td>
+                <td className="px-3 py-2 text-gray-500 dark:text-gray-400 font-mono text-xs">R{change.row_index}</td>
                <td className="px-3 py-2">
                  <span className="text-xs px-1.5 py-0.5 rounded bg-gray-100 dark:bg-gray-700 text-gray-600 dark:text-gray-400">
                    {FIELD_LABELS[change.field] || change.field}
                  </span>
                </td>
-                <td className="px-3 py-2">
-                  <span className="line-through text-red-500 dark:text-red-400">
-                    {change.old}
-                  </span>
-                </td>
-                <td className="px-3 py-2">
-                  <span className="text-green-600 dark:text-green-400 font-medium">
-                    {change.new}
-                  </span>
-                </td>
+                <td className="px-3 py-2"><span className="line-through text-red-500 dark:text-red-400">{change.old}</span></td>
+                <td className="px-3 py-2"><span className="text-green-600 dark:text-green-400 font-medium">{change.new}</span></td>
              </tr>
            ))}
          </tbody>
@@ -321,21 +384,14 @@ export function StepLlmReview({ sessionId, onNext }: StepLlmReviewProps) {

      {/* Actions */}
      <div className="flex items-center justify-between pt-2">
-        <p className="text-xs text-gray-400">
-          {accepted.size} von {changes.length} ausgewaehlt
-        </p>
+        <p className="text-xs text-gray-400">{accepted.size} von {changes.length} ausgewaehlt</p>
        <div className="flex gap-3">
-          <button
-            onClick={onNext}
-            className="px-4 py-2 text-sm border border-gray-300 dark:border-gray-600 rounded-lg hover:bg-gray-50 dark:hover:bg-gray-700 transition-colors text-gray-600 dark:text-gray-400"
-          >
+          <button onClick={onNext}
+            className="px-4 py-2 text-sm border border-gray-300 dark:border-gray-600 rounded-lg hover:bg-gray-50 dark:hover:bg-gray-700 transition-colors text-gray-600 dark:text-gray-400">
            Alle ablehnen
          </button>
-          <button
-            onClick={applyChanges}
-            disabled={applying || accepted.size === 0}
-            className="px-5 py-2 text-sm bg-teal-600 text-white rounded-lg hover:bg-teal-700 disabled:opacity-50 disabled:cursor-not-allowed transition-colors font-medium"
-          >
+          <button onClick={applyChanges} disabled={applying || accepted.size === 0}
+            className="px-5 py-2 text-sm bg-teal-600 text-white rounded-lg hover:bg-teal-700 disabled:opacity-50 disabled:cursor-not-allowed transition-colors font-medium">
            {applying ? 'Wird uebernommen...' : `${accepted.size} Korrektur${accepted.size !== 1 ? 'en' : ''} uebernehmen`}
          </button>
        </div>
@@ -4318,25 +4318,30 @@ import re as _re
 _OLLAMA_URL = os.getenv("OLLAMA_URL", os.getenv("OLLAMA_BASE_URL", "http://host.docker.internal:11434"))
 OLLAMA_REVIEW_MODEL = os.getenv("OLLAMA_REVIEW_MODEL", "qwen3:30b-a3b")

+# Regex: entry contains IPA phonetic brackets like "dance [dɑːns]"
+_HAS_PHONETIC_RE = _re.compile(r'\[.*?[ˈˌːʃʒθðŋɑɒɔəɜɪʊʌæ].*?\]')

-async def llm_review_entries(
-    entries: List[Dict],
-    model: str = None,
-) -> Dict:
-    """Send vocab entries to a local LLM for OCR error correction."""
-    model = model or OLLAMA_REVIEW_MODEL

-    # Build a compact table representation for the prompt
-    table_lines = []
-    for e in entries:
-        table_lines.append({
-            "row": e.get("row_index", 0),
-            "en": e.get("english", ""),
-            "de": e.get("german", ""),
-            "ex": e.get("example", ""),
-        })
+def _entry_needs_review(entry: Dict) -> bool:
+    """Check if an entry should be sent to the LLM for review.

-    prompt = f"""Du bist ein Korrekturleser fuer OCR-erkannte Vokabeltabellen (Englisch-Deutsch).
+    Skip entries that are empty or contain IPA phonetic transcriptions
+    (those were already corrected by the word dictionary lookup).
+    """
+    en = entry.get("english", "") or ""
+    de = entry.get("german", "") or ""
+    # Skip completely empty entries
+    if not en.strip() and not de.strip():
+        return False
+    # Skip entries with phonetic/IPA brackets — these are dictionary-corrected
+    if _HAS_PHONETIC_RE.search(en):
+        return False
+    return True
+
+
+def _build_llm_prompt(table_lines: List[Dict]) -> str:
+    """Build the LLM correction prompt for a batch of entries."""
+    return f"""Du bist ein Korrekturleser fuer OCR-erkannte Vokabeltabellen (Englisch-Deutsch).
 Die Tabelle wurde per OCR aus einem Schulbuch-Scan extrahiert. Korrigiere NUR offensichtliche OCR-Fehler.

 Haeufige OCR-Fehler die du korrigieren sollst:
@@ -4359,28 +4364,12 @@ Fuer unveraenderte Eintraege setze "corrected": false.
 Eingabe:
 {_json.dumps(table_lines, ensure_ascii=False, indent=2)}"""

-    t0 = time.time()
-    async with httpx.AsyncClient(timeout=300.0) as client:
-        resp = await client.post(
-            f"{_OLLAMA_URL}/api/chat",
-            json={
-                "model": model,
-                "messages": [{"role": "user", "content": prompt}],
-                "stream": False,
-                "options": {"temperature": 0.1, "num_predict": 8192},
-            },
-        )
-        resp.raise_for_status()
-        content = resp.json().get("message", {}).get("content", "")
-    duration_ms = int((time.time() - t0) * 1000)

-    # Parse LLM response — extract JSON array
-    corrected = _parse_llm_json_array(content)
-
-    # Build diff: compare original vs corrected
+def _diff_batch(originals: List[Dict], corrected: List[Dict]) -> Tuple[List[Dict], List[Dict]]:
+    """Compare original entries with LLM-corrected ones, return (changes, corrected_entries)."""
    changes = []
-    entries_corrected = []
-    for i, orig in enumerate(entries):
+    entries_out = []
+    for i, orig in enumerate(originals):
        if i < len(corrected):
            c = corrected[i]
            entry = dict(orig)
@@ -4396,19 +4385,171 @@ Eingabe:
                    })
                    entry[field_name] = new_val
                    entry["llm_corrected"] = True
-            entries_corrected.append(entry)
+            entries_out.append(entry)
        else:
-            entries_corrected.append(dict(orig))
+            entries_out.append(dict(orig))
+    return changes, entries_out
+
+
+async def llm_review_entries(
+    entries: List[Dict],
+    model: str = None,
+) -> Dict:
+    """Send vocab entries to a local LLM for OCR error correction (single batch)."""
+    model = model or OLLAMA_REVIEW_MODEL
+
+    # Filter: only entries that need review
+    reviewable = [(i, e) for i, e in enumerate(entries) if _entry_needs_review(e)]
+
+    if not reviewable:
+        return {
+            "entries_original": entries,
+            "entries_corrected": [dict(e) for e in entries],
+            "changes": [],
+            "skipped_count": len(entries),
+            "model_used": model,
+            "duration_ms": 0,
+        }
+
+    review_entries = [e for _, e in reviewable]
+    table_lines = [
+        {"row": e.get("row_index", 0), "en": e.get("english", ""), "de": e.get("german", ""), "ex": e.get("example", "")}
+        for e in review_entries
+    ]
+
+    prompt = _build_llm_prompt(table_lines)
+
+    t0 = time.time()
+    async with httpx.AsyncClient(timeout=300.0) as client:
+        resp = await client.post(
+            f"{_OLLAMA_URL}/api/chat",
+            json={
+                "model": model,
+                "messages": [{"role": "user", "content": prompt}],
+                "stream": False,
+                "options": {"temperature": 0.1, "num_predict": 8192},
+            },
+        )
+        resp.raise_for_status()
+        content = resp.json().get("message", {}).get("content", "")
+    duration_ms = int((time.time() - t0) * 1000)
+
+    corrected = _parse_llm_json_array(content)
+    changes, corrected_entries = _diff_batch(review_entries, corrected)
+
+    # Merge corrected entries back into the full list
+    all_corrected = [dict(e) for e in entries]
+    for batch_idx, (orig_idx, _) in enumerate(reviewable):
+        if batch_idx < len(corrected_entries):
+            all_corrected[orig_idx] = corrected_entries[batch_idx]

    return {
        "entries_original": entries,
-        "entries_corrected": entries_corrected,
+        "entries_corrected": all_corrected,
        "changes": changes,
+        "skipped_count": len(entries) - len(reviewable),
        "model_used": model,
        "duration_ms": duration_ms,
    }


+async def llm_review_entries_streaming(
+    entries: List[Dict],
+    model: str = None,
+    batch_size: int = 8,
+):
+    """Async generator: yield SSE events while reviewing entries in batches."""
+    model = model or OLLAMA_REVIEW_MODEL
+
+    # Separate reviewable from skipped entries
+    reviewable = []
+    skipped_indices = []
+    for i, e in enumerate(entries):
+        if _entry_needs_review(e):
+            reviewable.append((i, e))
+        else:
+            skipped_indices.append(i)
+
+    total_to_review = len(reviewable)
+
+    # meta event
+    yield {
+        "type": "meta",
+        "total_entries": len(entries),
+        "to_review": total_to_review,
+        "skipped": len(skipped_indices),
+        "model": model,
+        "batch_size": batch_size,
+    }
+
+    all_changes = []
+    all_corrected = [dict(e) for e in entries]
+    total_duration_ms = 0
+    reviewed_count = 0
+
+    # Process in batches
+    for batch_start in range(0, total_to_review, batch_size):
+        batch_items = reviewable[batch_start:batch_start + batch_size]
+        batch_entries = [e for _, e in batch_items]
+
+        table_lines = [
+            {"row": e.get("row_index", 0), "en": e.get("english", ""), "de": e.get("german", ""), "ex": e.get("example", "")}
+            for e in batch_entries
+        ]
+
+        prompt = _build_llm_prompt(table_lines)
+
+        t0 = time.time()
+        async with httpx.AsyncClient(timeout=300.0) as client:
+            resp = await client.post(
+                f"{_OLLAMA_URL}/api/chat",
+                json={
+                    "model": model,
+                    "messages": [{"role": "user", "content": prompt}],
+                    "stream": False,
+                    "options": {"temperature": 0.1, "num_predict": 4096},
+                },
+            )
+            resp.raise_for_status()
+            content = resp.json().get("message", {}).get("content", "")
+        batch_ms = int((time.time() - t0) * 1000)
+        total_duration_ms += batch_ms
+
+        corrected = _parse_llm_json_array(content)
+        batch_changes, batch_corrected = _diff_batch(batch_entries, corrected)
+
+        # Merge back
+        for batch_idx, (orig_idx, _) in enumerate(batch_items):
+            if batch_idx < len(batch_corrected):
+                all_corrected[orig_idx] = batch_corrected[batch_idx]
+
+        all_changes.extend(batch_changes)
+        reviewed_count += len(batch_items)
+
+        # Yield batch result
+        yield {
+            "type": "batch",
+            "batch_index": batch_start // batch_size,
+            "entries_reviewed": [e.get("row_index", 0) for _, e in batch_items],
+            "changes": batch_changes,
+            "duration_ms": batch_ms,
+            "progress": {"current": reviewed_count, "total": total_to_review},
+        }
+
+    # Complete event
+    yield {
+        "type": "complete",
+        "changes": all_changes,
+        "model_used": model,
+        "duration_ms": total_duration_ms,
+        "total_entries": len(entries),
+        "reviewed": total_to_review,
+        "skipped": len(skipped_indices),
+        "corrections_found": len(all_changes),
+        "entries_corrected": all_corrected,
+    }
+
+
 def _parse_llm_json_array(text: str) -> List[Dict]:
    """Extract JSON array from LLM response (may contain markdown fences)."""
    # Strip markdown code fences
@@ -51,6 +51,7 @@ from cv_vocab_pipeline import (
    dewarp_image,
    dewarp_image_manual,
    llm_review_entries,
+    llm_review_entries_streaming,
    render_image_high_res,
    render_pdf_high_res,
 )
@@ -1395,8 +1396,12 @@ async def get_word_ground_truth(session_id: str):


@router.post("/sessions/{session_id}/llm-review")
-async def run_llm_review(session_id: str, request: Request):
-    """Run LLM-based correction on vocab entries from Step 5."""
+async def run_llm_review(session_id: str, request: Request, stream: bool = False):
+    """Run LLM-based correction on vocab entries from Step 5.
+
+    Query params:
+        stream: false (default) for JSON response, true for SSE streaming
+    """
    session = await get_session_db(session_id)
    if not session:
        raise HTTPException(status_code=404, detail=f"Session {session_id} not found")
@@ -1417,6 +1422,14 @@ async def run_llm_review(session_id: str, request: Request):
        pass
    model = body.get("model") or OLLAMA_REVIEW_MODEL

+    if stream:
+        return StreamingResponse(
+            _llm_review_stream_generator(session_id, entries, word_result, model, request),
+            media_type="text/event-stream",
+            headers={"Cache-Control": "no-cache", "Connection": "keep-alive", "X-Accel-Buffering": "no"},
+        )
+
+    # Non-streaming path
    try:
        result = await llm_review_entries(entries, model=model)
    except Exception as e:
@@ -1449,6 +1462,44 @@ async def run_llm_review(session_id: str, request: Request):
    }


+async def _llm_review_stream_generator(
+    session_id: str,
+    entries: List[Dict],
+    word_result: Dict,
+    model: str,
+    request: Request,
+):
+    """SSE generator that yields batch-by-batch LLM review progress."""
+    try:
+        async for event in llm_review_entries_streaming(entries, model=model):
+            if await request.is_disconnected():
+                logger.info(f"SSE: client disconnected during LLM review for {session_id}")
+                return
+
+            yield f"data: {json.dumps(event, ensure_ascii=False)}\n\n"
+
+            # On complete: persist to DB
+            if event.get("type") == "complete":
+                word_result["llm_review"] = {
+                    "changes": event["changes"],
+                    "model_used": event["model_used"],
+                    "duration_ms": event["duration_ms"],
+                    "entries_corrected": event["entries_corrected"],
+                }
+                await update_session_db(session_id, word_result=word_result, current_step=6)
+                if session_id in _cache:
+                    _cache[session_id]["word_result"] = word_result
+
+                logger.info(f"LLM review SSE session {session_id}: {event['corrections_found']} changes, "
+                            f"{event['duration_ms']}ms, skipped={event['skipped']}, model={event['model_used']}")
+
+    except Exception as e:
+        import traceback
+        logger.error(f"LLM review SSE failed for {session_id}: {type(e).__name__}: {e}\n{traceback.format_exc()}")
+        error_event = {"type": "error", "detail": f"{type(e).__name__}: {e}"}
+        yield f"data: {json.dumps(error_event)}\n\n"
+
+
@router.post("/sessions/{session_id}/llm-review/apply")
 async def apply_llm_corrections(session_id: str, request: Request):
    """Apply selected LLM corrections to vocab entries."""