test+docs(rag): Tests und Entwicklerdoku fuer RAG Landkarte
- 44 Vitest-Tests: JSON-Struktur, Branchen-Zuordnung, Applicability Notes, Dokumenttyp-Verteilung, keine Duplikate - MkDocs-Seite: Architektur, 10 Branchen, Zuordnungslogik, Integration in andere Projekte, Datenquellen Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
This commit is contained in:
204
docs-src/services/klausur-service/RAG-Landkarte.md
Normal file
204
docs-src/services/klausur-service/RAG-Landkarte.md
Normal file
@@ -0,0 +1,204 @@
|
||||
# RAG Landkarte — Branchen-Regulierungs-Matrix
|
||||
|
||||
## Uebersicht
|
||||
|
||||
Die RAG Landkarte zeigt eine interaktive Matrix aller 320 Compliance-Dokumente im RAG-System, gruppiert nach Dokumenttyp und zugeordnet zu 10 Industriebranchen.
|
||||
|
||||
**URL**: `https://macmini:3002/ai/rag` → Tab "Landkarte"
|
||||
|
||||
**Letzte Aktualisierung**: 2026-04-15
|
||||
|
||||
## Architektur
|
||||
|
||||
```
|
||||
rag-documents.json ← Zentrale Datendatei (320 Dokumente)
|
||||
├── doc_types[] ← 17 Dokumenttypen (EU-VO, DE-Gesetz, etc.)
|
||||
├── industries[] ← 10 Branchen (VDMA/VDA/BDI)
|
||||
└── documents[] ← Alle Dokumente mit Branchen-Mapping
|
||||
├── code ← Eindeutiger Identifier
|
||||
├── name ← Anzeigename
|
||||
├── doc_type ← Verweis auf doc_types.id
|
||||
├── industries[] ← ["all"] oder ["automotive", "chemie", ...]
|
||||
├── in_rag ← true (alle im RAG)
|
||||
├── rag_collection ← Qdrant Collection Name
|
||||
├── description? ← Beschreibung (fuer ~100 Hauptregulierungen)
|
||||
├── applicability_note? ← Begruendung der Branchenzuordnung
|
||||
└── effective_date? ← Gueltigkeitsdatum
|
||||
|
||||
rag-constants.ts ← RAG-Metadaten (Chunks, Qdrant-IDs)
|
||||
page.tsx ← Frontend (importiert aus JSON)
|
||||
```
|
||||
|
||||
## Dateien
|
||||
|
||||
| Pfad | Beschreibung |
|
||||
|------|--------------|
|
||||
| `admin-lehrer/app/(admin)/ai/rag/rag-documents.json` | Alle 320 Dokumente mit Branchen-Mapping |
|
||||
| `admin-lehrer/app/(admin)/ai/rag/rag-constants.ts` | REGULATIONS_IN_RAG (Chunk-Counts, Qdrant-IDs) |
|
||||
| `admin-lehrer/app/(admin)/ai/rag/page.tsx` | Frontend-Rendering |
|
||||
| `admin-lehrer/app/(admin)/ai/rag/__tests__/rag-documents.test.ts` | 44 Tests fuer JSON-Validierung |
|
||||
|
||||
## Branchen (10 Industriesektoren)
|
||||
|
||||
Die Branchen orientieren sich an den Mitgliedsverbaenden von VDMA, VDA und BDI:
|
||||
|
||||
| ID | Branche | Icon | Typische Kunden |
|
||||
|----|---------|------|-----------------|
|
||||
| `automotive` | Automobilindustrie | 🚗 | OEMs, Tier-1/2 Zulieferer |
|
||||
| `maschinenbau` | Maschinen- & Anlagenbau | ⚙️ | Werkzeugmaschinen, Automatisierung |
|
||||
| `elektrotechnik` | Elektro- & Digitalindustrie | ⚡ | Embedded Systems, Steuerungstechnik |
|
||||
| `chemie` | Chemie- & Prozessindustrie | 🧪 | Grundstoffchemie, Spezialchemie |
|
||||
| `metall` | Metallindustrie | 🔩 | Stahl, Aluminium, Metallverarbeitung |
|
||||
| `energie` | Energie & Versorgung | 🔋 | Energieerzeugung, Netzbetreiber |
|
||||
| `transport` | Transport & Logistik | 🚚 | Gueterverkehr, Schiene, Luftfahrt |
|
||||
| `handel` | Handel | 🏪 | Einzel-/Grosshandel, E-Commerce |
|
||||
| `konsumgueter` | Konsumgueter & Lebensmittel | 📦 | FMCG, Lebensmittel, Verpackung |
|
||||
| `bau` | Bauwirtschaft | 🏗️ | Hoch-/Tiefbau, Gebaeudeautomation |
|
||||
|
||||
!!! warning "Keine Pseudo-Branchen"
|
||||
Es werden bewusst **keine** Querschnittsthemen wie IoT, KI, HR, KRITIS oder E-Commerce als "Branchen" gefuehrt. Diese sind Technologien, Abteilungen oder Klassifizierungen — keine Wirtschaftssektoren.
|
||||
|
||||
## Zuordnungslogik
|
||||
|
||||
### Drei Ebenen
|
||||
|
||||
| Ebene | `industries` Wert | Anzahl | Beispiele |
|
||||
|-------|-------------------|--------|-----------|
|
||||
| **Horizontal** | `["all"]` | 264 | DSGVO, AI Act, CRA, NIS2, BetrVG |
|
||||
| **Sektorspezifisch** | `["automotive", "chemie", ...]` | 42 | Maschinenverordnung, ElektroG, BattDG |
|
||||
| **Nicht zutreffend** | `[]` | 14 | DORA, MiCA, EHDS, DSA |
|
||||
|
||||
### Horizontal (alle Branchen)
|
||||
|
||||
Regulierungen die **branchenuebergreifend** gelten:
|
||||
|
||||
- **Datenschutz**: DSGVO, BDSG, ePrivacy, TDDDG, SCC, DPF
|
||||
- **KI**: AI Act (jedes Unternehmen das KI einsetzt)
|
||||
- **Cybersecurity**: CRA (jedes Produkt mit digitalen Elementen), NIS2, EUCSA
|
||||
- **Produktsicherheit**: GPSR, Produkthaftungs-RL
|
||||
- **Arbeitsrecht**: BetrVG, AGG, KSchG, ArbSchG, LkSG
|
||||
- **Handels-/Steuerrecht**: HGB, AO, UStG
|
||||
- **Software-Security**: OWASP Top 10, NIST SSDF, CISA Secure by Design
|
||||
- **Supply Chain**: CycloneDX, SPDX, SLSA (CRA verlangt SBOM)
|
||||
- **Alle Leitlinien**: EDPB, DSK, DSFA-Listen, Gerichtsurteile
|
||||
|
||||
### Sektorspezifisch
|
||||
|
||||
| Regulierung | Branchen | Begruendung |
|
||||
|-------------|----------|-------------|
|
||||
| Maschinenverordnung | Maschinenbau, Automotive, Elektrotechnik, Metall, Bau | Hersteller von Maschinen und zugehoerigen Produkten |
|
||||
| ElektroG | Elektrotechnik, Automotive, Konsumgueter | Elektro-/Elektronikgeraete |
|
||||
| BattDG/BattVO | Automotive, Elektrotechnik, Energie | Batterien und Akkumulatoren |
|
||||
| VerpackG | Konsumgueter, Handel, Chemie | Verpackungspflichtige Produkte |
|
||||
| PAngV, UWG, VSBG | Handel, Konsumgueter | Verbraucherschutz im Verkauf |
|
||||
| BSI-KritisV, KRITIS-Dachgesetz | Energie, Transport, Chemie | KRITIS-Sektoren |
|
||||
| ENISA ICS/SCADA | Maschinenbau, Elektrotechnik, Automotive, Chemie, Energie, Transport | Industrielle Steuerungstechnik |
|
||||
| NIST SP 800-82 (OT) | Maschinenbau, Automotive, Elektrotechnik, Chemie, Energie, Metall | Operational Technology |
|
||||
|
||||
### Nicht zutreffend
|
||||
|
||||
Dokumente die **im RAG bleiben** aber fuer keine der 10 Zielbranchen relevant sind:
|
||||
|
||||
| Code | Name | Grund |
|
||||
|------|------|-------|
|
||||
| DORA | Digital Operational Resilience Act | Finanzsektor |
|
||||
| PSD2 | Zahlungsdiensterichtlinie | Zahlungsdienstleister |
|
||||
| MiCA | Markets in Crypto-Assets | Krypto-Maerkte |
|
||||
| AMLR | AML-Verordnung | Geldwaesche-Bekaempfung |
|
||||
| EHDS | Europaeischer Gesundheitsdatenraum | Gesundheitswesen |
|
||||
| DSA | Digital Services Act | Online-Plattformen |
|
||||
| DMA | Digital Markets Act | Gatekeeper-Plattformen |
|
||||
| MDR | Medizinprodukteverordnung | Medizintechnik |
|
||||
| BSI-TR-03161 | DiGA-Sicherheit (3 Teile) | Digitale Gesundheitsanwendungen |
|
||||
|
||||
## Dokumenttypen (17)
|
||||
|
||||
| doc_type | Label | Anzahl | Beispiele |
|
||||
|----------|-------|--------|-----------|
|
||||
| `eu_regulation` | EU-Verordnungen | 22 | DSGVO, AI Act, CRA, DORA |
|
||||
| `eu_directive` | EU-Richtlinien | 14 | ePrivacy, NIS2, PSD2 |
|
||||
| `eu_guidance` | EU-Leitfaeden | 9 | Blue Guide, GPAI CoP |
|
||||
| `de_law` | Deutsche Gesetze | 41 | BDSG, BGB, HGB, BetrVG |
|
||||
| `at_law` | Oesterreichische Gesetze | 11 | DSG AT, ECG, KSchG |
|
||||
| `ch_law` | Schweizer Gesetze | 8 | revDSG, DSV, OR |
|
||||
| `national_law` | Nationale Datenschutzgesetze | 17 | UK DPA, LOPDGDD, UAVG |
|
||||
| `bsi_standard` | BSI Standards & TR | 4 | BSI 200-4, BSI-TR-03161 |
|
||||
| `edpb_guideline` | EDPB/WP29 Leitlinien | 50 | Consent, Controller/Processor |
|
||||
| `dsk_guidance` | DSK Orientierungshilfen | 57 | Kurzpapiere, OH Telemedien |
|
||||
| `court_decision` | Gerichtsurteile | 20 | BAG M365, BGH Planet49 |
|
||||
| `dsfa_list` | DSFA Muss-Listen | 20 | Pro Bundesland + DSK |
|
||||
| `nist_standard` | NIST Standards | 11 | CSF 2.0, SSDF, AI RMF |
|
||||
| `owasp_standard` | OWASP Standards | 6 | Top 10, ASVS, API Security |
|
||||
| `enisa_guidance` | ENISA Guidance | 6 | Supply Chain, ICS/SCADA |
|
||||
| `international` | Internationale Standards | 7 | CVSS, CycloneDX, SPDX |
|
||||
| `legal_template` | Vorlagen & Muster | 17 | GitHub Policies, VVT-Muster |
|
||||
|
||||
## Integration in andere Projekte
|
||||
|
||||
### JSON importieren
|
||||
|
||||
```typescript
|
||||
import ragData from './rag-documents.json'
|
||||
|
||||
const documents = ragData.documents // 320 Dokumente
|
||||
const docTypes = ragData.doc_types // 17 Kategorien
|
||||
const industries = ragData.industries // 10 Branchen
|
||||
```
|
||||
|
||||
### Matrix-Logik
|
||||
|
||||
```typescript
|
||||
// Pruefen ob Dokument fuer Branche gilt
|
||||
const applies = (doc, industryId) =>
|
||||
doc.industries.includes(industryId) || doc.industries.includes('all')
|
||||
|
||||
// Dokumente nach Typ gruppieren
|
||||
const grouped = Object.groupBy(documents, d => d.doc_type)
|
||||
|
||||
// Nur sektorspezifische Dokumente fuer eine Branche
|
||||
const forAutomotive = documents.filter(d =>
|
||||
d.industries.includes('automotive') && !d.industries.includes('all')
|
||||
)
|
||||
```
|
||||
|
||||
### RAG-Status pruefen
|
||||
|
||||
```typescript
|
||||
import { REGULATIONS_IN_RAG } from './rag-constants'
|
||||
|
||||
const isInRag = (code: string) => code in REGULATIONS_IN_RAG
|
||||
const chunks = REGULATIONS_IN_RAG['GDPR']?.chunks // 423
|
||||
```
|
||||
|
||||
## Datenquellen
|
||||
|
||||
| Quelle | Pfad | Beschreibung |
|
||||
|--------|------|--------------|
|
||||
| RAG-Inventar | `~/Desktop/RAG-Dokumenten-Inventar.md` | 386 Quelldateien |
|
||||
| rag-documents.json | `admin-lehrer/.../rag/rag-documents.json` | 320 konsolidierte Dokumente |
|
||||
| rag-constants.ts | `admin-lehrer/.../rag/rag-constants.ts` | Qdrant-Metadaten |
|
||||
|
||||
## Tests
|
||||
|
||||
```bash
|
||||
cd admin-lehrer
|
||||
npx vitest run app/\(admin\)/ai/rag/__tests__/rag-documents.test.ts
|
||||
```
|
||||
|
||||
44 Tests validieren:
|
||||
|
||||
- JSON-Struktur (doc_types, industries, documents)
|
||||
- 10 echte Branchen (keine Pseudo-Branchen)
|
||||
- Pflichtfelder und gueltige Referenzen
|
||||
- Horizontale Regulierungen (DSGVO, AI Act, CRA → "all")
|
||||
- Sektorspezifische Zuordnungen (Maschinenverordnung, ElektroG)
|
||||
- Nicht zutreffende Regulierungen (DORA, MiCA → leer)
|
||||
- Applicability Notes vorhanden und korrekt
|
||||
|
||||
## Aenderungshistorie
|
||||
|
||||
| Datum | Aenderung |
|
||||
|-------|-----------|
|
||||
| 2026-04-15 | Initiale Implementierung: 320 Dokumente, 10 Branchen, 17 Typen |
|
||||
| 2026-04-15 | Branchen-Review: OWASP/SBOM → alle, BSI-TR-03161 → leer |
|
||||
| 2026-04-15 | Applicability Notes UI: Aufklappbare Erklaerungen pro Dokument |
|
||||
Reference in New Issue
Block a user