fix(ucca): Guidance-Intent für direkt benannte WP/GL-Dokumente #42
Reference in New Issue
Block a user
Delete Branch "fix/legal-rag-guidance-intent"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Was & Warum
Dieser Fix ist kein allgemeiner Retrieval-Umbau. Er erweitert nur die Guidance-Intent-Erkennung, damit das bereits vorhandene Authority-Reranking bei expliziten WP/GL-Fragen greift.
queryWantsGuidanceverfehlte rein dokument-namige Fragen („Welche Kriterien nennt WP248 …", „Was sagt GL 07/2020 …"):guidanceIntentSignalsenthielt Herausgeber (edpb/dsk/enisa) und Verben (empfiehlt/laut), aber keine Working-Paper-/Guideline-Identifier. Dadurch feuerte der Authority-Lift nie →binding_law(im homogenen Korpus sogar off-domain MaschinenVO/CRA) verdrängte diesupervisory_guidanceaus den Top-K.Änderung
Eine Zeile:
guidanceIntentSignals += "wp2", "wp 2", "wp29", "working paper", "gl 0".Generisch über alle WP-/GL-Dokumente — keine doc-spezifische Regel (Query → Intent, nicht Query → konkretes Dokument). Hybrid/Binding/Embeddings unverändert.
Validierung (deterministisch, echtes
LegalRAGClient.SearchCollection, bge-m3 + Qdrant Cosine)Build-Collection (homogener Korpus, zeigt den Qualitätsgewinn):
dev
bp_compliance_ce(Live-Collection, Regressions-Gate):cenoch nicht vorhanden (SGE-Units nur in der Build-Collection) → der Qualitätsgewinn wird erst nach dem Blue-Green-Switch sichtbar. Inert, nicht schädlich.Merge-Gate
go test ./internal/ucca/grün (e2e wird ohneRUN_E2E=1ge-skipped)ce: 0 Norm-RegressionenDeploy
Merge/Deploy erst nach separatem Go. Empfehlung: mit dem Blue-Green-Switch der KB-2026.1-Build-Collection bündeln — dann arrivieren Fix und die Guidance-Units, die er anhebt, gemeinsam.
🤖 Generated with Claude Code
queryWantsGuidance verfehlte rein dokument-namige Fragen ("Welche Kriterien nennt WP248 ...", "Was sagt GL 07/2020 ..."): guidanceIntentSignals enthielt zwar Herausgeber (edpb/dsk/enisa) und Verben (empfiehlt/laut), aber keine Working-Paper-/Guideline-Identifier. Dadurch loeste der Authority-Lift nicht aus -> binding_law (bzw. im homogenen Korpus sogar off-domain MaschVO/CRA) verdraengte die Guidance aus den Top-K. Fix: WP2xx / GL 0x / "working paper" als Guidance-Signal ergaenzt. Generisch ueber alle WP-/GL-Dokumente, KEINE doc-spezifische Regel (Query->Intent, nicht Query->konkretes Dokument). Validierung (homogener Build-Korpus, bge-m3 + Qdrant Cosine): - 10 Hard Cases: 8/10 -> 10/10 (WP248/WP260 zurueck in Top-8) - ComplianceBench-100: 0/100 Norm-Fragen veraendert (Freeze-Regression gruen), 18/18 Guidance-Intent-Fragen verbessert (binding -> korrekte Guidance-Klasse) - Hybrid == Dense (Keyword-RRF war NICHT die Ursache, der Lift-Gate war es) Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>31562a31e9to4818fc51c2