Benjamin_Boenisch/breakpilot-compliance

Fork 0

Files

T

Benjamin Admin a3053c3c86

CI / detect-changes (push) Successful in 14s

Details

CI / branch-name (push) Has been skipped

Details

CI / guardrail-integrity (push) Has been skipped

Details

CI / secret-scan (push) Has been skipped

Details

CI / dep-audit (push) Has been skipped

Details

CI / sbom-scan (push) Has been skipped

Details

CI / build-sha-integrity (push) Successful in 9s

Details

CI / validate-canonical-controls (push) Successful in 19s

Details

CI / loc-budget (push) Successful in 23s

Details

CI / go-lint (push) Has been skipped

Details

CI / python-lint (push) Has been skipped

Details

CI / nodejs-lint (push) Has been skipped

Details

CI / nodejs-build (push) Has been skipped

Details

CI / test-go (push) Has been skipped

Details

CI / iace-gt-coverage (push) Has been skipped

Details

CI / test-python-backend (push) Has been skipped

Details

CI / test-python-document-crawler (push) Has been skipped

Details

CI / test-python-dsms-gateway (push) Has been skipped

Details

docs(architecture): RAG retrieval engine architecture set (01-09)

9 docs + index in docs-src/architecture/ documenting the deterministic
retrieval engine: retrieval pipeline, authority rerank, source_class,
source_role, control-intent + diversity, assessment, confidence,
explainability + supersede, framework_* layer. Each doc carries the exact
constants, the rationale behind them, code refs, and the failure class
it addresses. Audit/onboarding reference.

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>

2026-06-25 09:25:22 +02:00

3.4 KiB

Raw Blame History

02 — Authority-Re-Ranking

Zweck: Bindendes Recht der passenden Jurisdiktion/Domäne nach oben, Guidance/Fremdrecht/Off-Domain nach unten — Reihenfolge only, nichts wird gelöscht. Der Score trägt nach dem Rerank den Authority-Score, damit nachgelagerte Multi-Collection-Merges (Advisor) die Ordnung bewahren.

Mechanik

authorityScore() (authority_rerank.go) berechnet pro Treffer einen normativen Relevanz-Score aus dem rohen Semantik-Score + gewichteter Autorität + Kontext-Bonus/Penalty:

score = rawSemantic
      + authorityCoef · weight/100                 (Autorität, siehe 03)
      + jurisdictionGain   (DE/EU-Match)
      − foreignPenalty     (CH bei DE/EU-Frage)
      − unknownPenalty     (unbekannte Klasse)
      + domainMatchGain    (Chunk-Domäne == Query-Domäne)
      − offDomainPenalty   (bindend, aber off-domain)
      − scopePenalty       (BDSG Teil 3 bei allgemeiner DS-Frage)
      + topicGain          (bevorzugte kanonische Norm)
      − supersededPenalty  (status="superseded")

rerankByAuthority() sortiert stabil nach diesem Score und schreibt ihn zurück. liftAboveBinding() hebt bei Auslegungs-Intent eine semantisch konkurrenzfähige Guidance knapp über das bindende Recht — mit Margin-Guard, damit off-topic-Guidance das Gesetz nicht überholt.

Konstanten + Warum

Konstante	Wert	Warum
`authorityCoef`	`0.40`	Gewicht→Score-Multiplikator. Konservativ kalibriert gegen die Offline-Golden-Harness (Phase A): hoch genug, dass bindendes Recht gewinnt, niedrig genug, dass starke Semantik nicht erschlagen wird
`jurisdictionGain`	`0.05`	leichter Vorzug für DE/EU-Quellen bei DE/EU-Frage
`foreignPenalty`	`0.60`	Fremdrecht (CH) bei DE/EU-Frage klar demoten — aber nicht entfernen (Vergleichsfälle bleiben auffindbar)
`unknownPenalty`	`0.08`	unklassifizierte Quellen leicht zurückstufen
`domainMatchGain`	`0.15`	Domänen-Treffer (data_protection / cyber / ai / product_safety) belohnen
`offDomainPenalty`	`0.10`	bindende, aber fachfremde Norm demoten (z.B. DSGVO bei reiner Cyber-Frage)
`scopePenalty`	`0.25`	BDSG §45–84 (Justiz/Strafverfolgung) bei allgemeiner DS-Frage zurückstufen — häufige Scope-Verwechslung
`topicGain`	`0.18`	Verstärker für bevorzugte kanonische Normen (z.B. Art. 37 DSGVO bei DSB-Fragen)
`supersededPenalty`	`0.50`	abgelöste Alt-Quelle demoten, „damit Default-Fragen die eu-v1-Norm sehen, History aber auffindbar bleibt"
`intentLiftGain`	`0.10`	Epsilon-Lift einer Guidance über das beste bindende Recht bei Auslegungs-Intent
`intentLiftMargin`	`0.05`	Guard: Lift nur, wenn die Semantik innerhalb von 0.05 zum besten bindenden Treffer liegt

Auslegungs-Intent-Signale (guidanceIntentSignals): edpb, dsk, enisa, bsi, leitlinie, guideline, orientierungshilfe, auslegung, empfiehlt, empfehlung, sagt, laut, …

Code

authority_rerank.go → authorityScore(), rerankByAuthority(), bestBindingSemantic(), liftAboveBinding()

Adressierte Fehlerklassen

„Guidance verdrängt Gesetz" → authorityCoef·weight hebt bindendes Recht; liftAboveBinding nur mit Margin-Guard.
„Fremdrecht Top-1" → foreignPenalty.
„Off-Domain-Gesetz dominiert" → domainMatchGain / offDomainPenalty / scopePenalty.
„Veraltete Norm gewinnt" → supersededPenalty (siehe 08).

3.4 KiB Raw Blame History Unescape Escape

02 — Authority-Re-Ranking

Mechanik

Konstanten + Warum

Code

Adressierte Fehlerklassen

3.4 KiB

Raw Blame History