# Document Crawler — Dokumentenanalyse Automatische Erfassung und Analyse von Compliance-Dokumenten auf Webseiten und in Dateisystemen. ## Features - **Web-Crawling** — Automatisches Scannen von Webseiten nach Datenschutzerklaerungen, Impressum und Cookie-Bannern - **Dokumentenanalyse** — KI-gestuetzte Pruefung auf Vollstaendigkeit und Aktualitaet - **DSGVO-Check** — Automatische Pruefung gegen Pflichtangaben (Art. 13/14 DSGVO) - **Monitoring** — Regelmaessige Ueberpruefung mit Benachrichtigung bei Aenderungen - **Quellen-Verwaltung** — Konfigurierbare Crawl-Ziele und Zeitplaene ## API Endpoints Alle unter `/api/v1/crawler/`, benoetigen `X-Tenant-ID` Header. | Method | Endpoint | Beschreibung | |--------|----------|-------------| | GET | `/jobs` | Crawl-Jobs auflisten | | POST | `/jobs` | Neuen Crawl-Job starten | | GET | `/jobs/{id}` | Job-Status | | GET | `/results` | Crawl-Ergebnisse | | GET | `/results/{id}` | Einzelnes Ergebnis | | POST | `/results/{id}/analyze` | KI-Analyse starten | ## Frontend Seite unter `/sdk/document-crawler` mit Job-Verwaltung, Ergebnis-Uebersicht und Analyse-Detail. ## Datenbank Migration in der AI Compliance SDK erstellt Tabellen fuer Crawl-Jobs, Ergebnisse und Analysen.