Benjamin_Boenisch/breakpilot-compliance

Fork 0

Files

T

Benjamin Admin a3053c3c86

CI / detect-changes (push) Successful in 14s

Details

CI / branch-name (push) Has been skipped

Details

CI / guardrail-integrity (push) Has been skipped

Details

CI / secret-scan (push) Has been skipped

Details

CI / dep-audit (push) Has been skipped

Details

CI / sbom-scan (push) Has been skipped

Details

CI / build-sha-integrity (push) Successful in 9s

Details

CI / validate-canonical-controls (push) Successful in 19s

Details

CI / loc-budget (push) Successful in 23s

Details

CI / go-lint (push) Has been skipped

Details

CI / python-lint (push) Has been skipped

Details

CI / nodejs-lint (push) Has been skipped

Details

CI / nodejs-build (push) Has been skipped

Details

CI / test-go (push) Has been skipped

Details

CI / iace-gt-coverage (push) Has been skipped

Details

CI / test-python-backend (push) Has been skipped

Details

CI / test-python-document-crawler (push) Has been skipped

Details

CI / test-python-dsms-gateway (push) Has been skipped

Details

docs(architecture): RAG retrieval engine architecture set (01-09)

9 docs + index in docs-src/architecture/ documenting the deterministic
retrieval engine: retrieval pipeline, authority rerank, source_class,
source_role, control-intent + diversity, assessment, confidence,
explainability + supersede, framework_* layer. Each doc carries the exact
constants, the rationale behind them, code refs, and the failure class
it addresses. Audit/onboarding reference.

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>

2026-06-25 09:25:22 +02:00

2.2 KiB

Raw Blame History

06 — Assessment

Zweck: Eine auditierbare Begründungsschicht über die gerankten Ergebnisse. Sie macht aus einer Trefferliste eine prüfbare Aussage: Welche Norm ist primär, welche hängen daran, wie eindeutig ist das, braucht es einen Menschen?

Mechanik

Assess() (legal_rag_assess.go) nimmt die bereits gerankten results []LegalSearchResult und baut ein LegalAssessment:

Feld	Inhalt
`PrimaryNorm`	`CitationUnit` bzw. `ArticleLabel` des Top-Treffers
`PrimaryRegulation`	`RegulationShort` des Top-Treffers
`ConnectedNorms`	verbundene Normen (`references_out` + `references_in`), gekappt + dedupliziert
`CrossRegime`	ob mehrere Regulierungen in den Top-N liegen
`WinnerMargin`	Score-Abstand Top-1 ↔ Top-2 (Proxy für Eindeutigkeit)
`HumanReviewFlag`	true bei niedriger Eindeutigkeit
`ScoreReasoning`	kurze deutsche Begründung

Konstanten + Warum

Konstante	Wert	Warum
`assessConnectedCap`	`12`	Obergrenze der in der Assessment gezeigten verbundenen Normen — verhindert, dass ein stark vernetzter Artikel die Begründung flutet
`assessCrossRegimeTopN`	`5`	Fenster, über das „Cross-Regime" (mehrere Regulierungen) beurteilt wird
`assessReviewMargin`	`0.05`	enger Winner-Abstand → Human-Review-Flag (siehe 07)

Human-Review-Logik

HumanReviewFlag wird true, wenn eine der Bedingungen gilt:

WinnerMargin < 0.05 — Top-1 und Top-2 liegen zu dicht beieinander (uneindeutig),
CrossRegime == true — mehrere Regimes betroffen (z.B. DSGVO + CRA),
der Primär-Treffer ist nicht binding_law — eine Rechtsaussage ohne bindende Primärquelle.

Das ist die deterministische Eskalations-Schwelle: das System sagt von sich aus „hier sollte ein Mensch drauf schauen", statt scheinbare Sicherheit vorzutäuschen.

Code

legal_rag_assess.go → Assess(), primaryLabel()

Adressierte Fehlerklassen

„uneindeutige Antwort wird als sicher verkauft" → WinnerMargin + HumanReviewFlag.
„Cross-Regime übersehen" → CrossRegime über assessCrossRegimeTopN.
„Rechtsaussage ohne bindende Quelle" → Flag bei nicht-bindendem Primär-Treffer.

2.2 KiB Raw Blame History

06 — Assessment

Mechanik

Konstanten + Warum

Human-Review-Logik

Code

Adressierte Fehlerklassen

2.2 KiB

Raw Blame History