feat(scope): Split HT-H01 B2B/B2C + register Verbraucherschutz document types + RAG ingestion
Some checks failed
CI/CD / go-lint (push) Has been skipped
CI/CD / python-lint (push) Has been skipped
CI/CD / nodejs-lint (push) Has been skipped
CI/CD / test-go-ai-compliance (push) Successful in 38s
CI/CD / test-python-backend-compliance (push) Successful in 39s
CI/CD / test-python-document-crawler (push) Successful in 27s
CI/CD / test-python-dsms-gateway (push) Successful in 24s
CI/CD / deploy-hetzner (push) Has been cancelled

- Split HT-H01 into HT-H01a (B2C/Hybrid mit Verbraucherschutzpflichten) und
  HT-H01b (reiner B2B mit Basis-Pflichten). B2B-Webshops bekommen keine
  Widerrufsbelehrung/Preisangaben/Fernabsatz mehr.
- Add excludeWhen/requireWhen to HardTriggerRule for conditional trigger logic
- Register 6 neue ScopeDocumentType: widerrufsbelehrung, preisangaben,
  fernabsatz_info, streitbeilegung, produktsicherheit, ai_act_doku
- Full DOCUMENT_SCOPE_MATRIX L1-L4 for all new types
- Align HardTriggerRule interface with actual engine field names
- Add Phase H (Verbraucherschutz) to RAG ingestion script:
  10 deutsche Gesetze + 4 EU-Verordnungen + HLEG Ethics Guidelines
- Add scripts/rag-sources.md with license documentation
- 9 new tests for B2B/B2C trigger split, all 326 tests pass

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
Benjamin Admin
2026-03-11 16:03:49 +01:00
parent cb48b8289e
commit 7f38df9d9c
5 changed files with 666 additions and 20 deletions

77
scripts/rag-sources.md Normal file
View File

@@ -0,0 +1,77 @@
# RAG-Quellennachweis — BreakPilot Compliance
Stand: 2026-03-11
## Collection: bp_compliance_gesetze
| # | Dokument | Quelle | Lizenz |
|---|----------|--------|--------|
| 1 | DDG § 5 (Impressum) | gesetze-im-internet.de | Public Domain (§ 5 UrhG) |
| 2 | TDDDG § 25 (Cookies) | gesetze-im-internet.de | Public Domain (§ 5 UrhG) |
| 3 | UrhG § 5 (Amtliche Werke) | gesetze-im-internet.de | Public Domain (§ 5 UrhG) |
| 4 | EGBGB Muster-Widerrufsbelehrung | gesetze-im-internet.de | Public Domain (§ 5 UrhG) |
| 5 | BGB (komplett) | github.com/bundestag/gesetze | Unlicense |
| 6 | UrhG (komplett) | github.com/bundestag/gesetze | Unlicense |
| 7 | TMG (komplett) | github.com/bundestag/gesetze | Unlicense |
| 8 | PAngV (Preisangabenverordnung) | gesetze-im-internet.de | Public Domain (§ 5 UrhG) |
| 9 | VSBG (Verbraucherstreitbeilegungsgesetz) | gesetze-im-internet.de | Public Domain (§ 5 UrhG) |
| 10 | ProdHaftG (Produkthaftungsgesetz) | gesetze-im-internet.de | Public Domain (§ 5 UrhG) |
| 11 | VerpackG (Verpackungsgesetz) | gesetze-im-internet.de | Public Domain (§ 5 UrhG) |
| 12 | ElektroG (WEEE) | gesetze-im-internet.de | Public Domain (§ 5 UrhG) |
| 13 | BattDG (Batterierecht) | gesetze-im-internet.de | Public Domain (§ 5 UrhG) |
| 14 | BFSG (Barrierefreiheit) | gesetze-im-internet.de | Public Domain (§ 5 UrhG) |
| 15 | UWG (Unlauterer Wettbewerb) | gesetze-im-internet.de | Public Domain (§ 5 UrhG) |
| 16 | BGB (Fernabsatz/Digitale Inhalte/Kaufrecht) | gesetze-im-internet.de | Public Domain (§ 5 UrhG) |
| 17 | EGBGB (Muster-Widerrufsbelehrung Anlage 1+2) | gesetze-im-internet.de | Public Domain (§ 5 UrhG) |
## Collection: bp_compliance_ce
| # | Dokument | Quelle | Lizenz |
|---|----------|--------|--------|
| 1 | Digital Services Act (EU) 2022/2065 | eur-lex.europa.eu | CC BY 4.0 |
| 2 | ePrivacy-Richtlinie 2002/58/EC | eur-lex.europa.eu | CC BY 4.0 |
| 3 | Standardvertragsklauseln (EU) 2021/914 | eur-lex.europa.eu | CC BY 4.0 |
| 4 | GPSR (EU) 2023/988 | eur-lex.europa.eu | CC BY 4.0 |
| 5 | AI Act (EU) 2024/1689 | eur-lex.europa.eu | CC BY 4.0 |
| 6 | Batterieverordnung (EU) 2023/1542 | eur-lex.europa.eu | CC BY 4.0 |
| 7 | Digitale-Inhalte-RL (EU) 2019/770 | eur-lex.europa.eu | CC BY 4.0 |
## Collection: bp_legal_templates
| # | Dokument | Quelle | Lizenz |
|---|----------|--------|--------|
| 1 | GitHub Site Policy | github.com/github/site-policy | CC0 |
| 2 | OpenGov Site Policy | github.com/opengovfoundation/site-policy | CC0 |
| 3 | CC Legal Tools | github.com/creativecommons/cc-legal-tools-data | CC0 |
| 4 | opr.vc DSGVO-Mustertexte | github.com/oprvc/oprvc.github.io | CC0 |
| 5 | webflorist Privacy Policy Text | github.com/webflorist/privacy-policy-text | MIT |
| 6 | Tempest Privacy Policy Generator | github.com/Tempest-Solutions-Company | MIT |
| 7 | Tempest Terms of Service Generator | github.com/Tempest-Solutions-Company | MIT |
| 8 | Tempest Cookie Banner | github.com/Tempest-Solutions-Company | MIT |
| 9 | CookieConsent (orestbida) | github.com/orestbida/cookieconsent | MIT |
| 10 | CommonPaper CSA/SLA/PSA | github.com/CommonPaper | CC BY 4.0 |
| 11 | Datennutzungsklauseln | gitlab.opencode.de/wernerth | CC BY 4.0 |
## Collection: bp_compliance_datenschutz
| # | Dokument | Quelle | Lizenz |
|---|----------|--------|--------|
| 1 | EDPB Guidelines 05/2020 Consent | edpb.europa.eu | Reuse Notice |
| 2 | EDPB Guidelines 4/2019 Privacy by Design | edpb.europa.eu | Reuse Notice |
| 3 | EDPB Guidelines 03/2022 Dark Patterns | edpb.europa.eu | Reuse Notice |
| 4 | EDPB Guidelines 8/2020 Social Media Targeting | edpb.europa.eu | Reuse Notice |
| 5 | EDPB Cookie Banner Taskforce Report 2023 | edpb.europa.eu | Reuse Notice |
| 6 | EDPB Guidelines 2/2023 ePrivacy Art. 5(3) | edpb.europa.eu | Reuse Notice |
| 7 | EDPB Guidelines 1/2024 Legitimate Interest | edpb.europa.eu | Reuse Notice |
| 8 | EDPB DPO Enforcement Report 2024 | edpb.europa.eu | Reuse Notice |
| 9 | EDPS GenAI Orientations 2024 | edps.europa.eu | Reuse Notice |
| 10 | EDPS Digital Ethics Report 2018 | edps.europa.eu | Reuse Notice |
| 11 | HLEG Ethics Guidelines Trustworthy AI | op.europa.eu | CC BY 4.0 |
## Lizenz-Hinweise
- **Public Domain (§ 5 UrhG):** Deutsche amtliche Werke (Gesetze, Verordnungen) sind gemeinfrei.
- **CC BY 4.0:** EU-Rechtstexte und EU-Publikationen. Attribution: "European Union, https://eur-lex.europa.eu"
- **CC0:** Public-Domain-Widmung, keine Einschraenkungen.
- **MIT:** Permissive Open-Source-Lizenz, kommerzielle Nutzung erlaubt.
- **Reuse Notice:** EDPB/EDPS-Dokumente duerfen unter Quellenangabe wiederverwendet werden.