Scraper laeuft

{status?.current_source && (

Aktuell: {status.current_source}

)}

)} {/* Tabs */}

{[ { id: 'sources', name: 'Quellen', icon: '📚' }, { id: 'pdf', name: 'PDF-Extraktion', icon: '📄' }, { id: 'status', name: 'Status', icon: '📊' }, { id: 'logs', name: 'Ergebnisse', icon: '📝' }, ].map(tab => ( ))}

{/* Sources Tab */} {activeTab === 'sources' && (

{/* Header */}

Regulierungsquellen

EU-Lex, BSI-TR und deutsche Gesetze

{/* Sources by Type */}

{/* EU Regulations */}

🇪🇺 EU-Regulierungen (EUR-Lex)

{sources.filter(s => s.source_type === 'eur_lex').map(source => ( ))}

{/* BSI Standards */}

🔒 BSI Technical Guidelines

{sources.filter(s => s.source_type === 'bsi_pdf').map(source => ( ))}

)} {/* PDF Extraction Tab */} {activeTab === 'pdf' && (

PDF-Extraktion (PyMuPDF)

Extrahiert ALLE Pruefaspekte aus BSI-TR-03161 PDFs mit Regex-Pattern-Matching

{/* PDF Documents */}

{pdfDocuments.map(doc => (

📄

{doc.code} {doc.available ? 'Verfuegbar' : 'Nicht gefunden'}

{doc.name}

{doc.description}

Erwartete Pruefaspekte: {doc.expected_aspects}

))}

{/* Last Extraction Result */} {pdfResult && (

Letztes Extraktions-Ergebnis

{pdfResult.total_aspects}

Pruefaspekte gefunden

{pdfResult.requirements_created}

Requirements erstellt

{Object.keys(pdfResult.statistics.by_category || {}).length}

Kategorien

{/* Category Breakdown */} {pdfResult.statistics.by_category && Object.keys(pdfResult.statistics.by_category).length > 0 && (

Nach Kategorie:

{Object.entries(pdfResult.statistics.by_category).map(([cat, count]) => ( {cat}: {count} ))}

)}

)} {/* Info Box */}

Wie funktioniert die PDF-Extraktion?

• PyMuPDF (fitz) liest den PDF-Text
• Regex-Pattern finden Aspekte wie O.Auth_1, O.Sess_2, T.Network_1
• Kontextanalyse extrahiert Titel, Kategorie und Anforderungsstufe (MUSS/SOLL/KANN)
• Automatische Speicherung erstellt Requirements in der Datenbank

)} {/* Status Tab */} {activeTab === 'status' && status && (

{/* Current Status */}

Scraper-Status

Letzter Lauf: {status.stats.last_run ? new Date(status.stats.last_run).toLocaleString('de-DE') : 'Noch nie'}

{status.status === 'running' ? '🔄 Laeuft' : status.status === 'error' ? '❌ Fehler' : status.status === 'completed' ? '✅ Abgeschlossen' : '⏸️ Bereit'}

{status.stats.sources_processed}

Quellen verarbeitet

{status.stats.requirements_extracted}

Anforderungen extrahiert

{status.stats.errors}

Fehler

{status.last_error && (

Letzter Fehler: {status.last_error}

)}

{/* Process Description */}

Wie funktioniert der Scraper?

EUR-Lex Abruf: Holt HTML-Version der EU-Verordnung, extrahiert Artikel und Absaetze

BSI-TR Parsing: Extrahiert Pruefaspekte (O.Auth_1, O.Sess_1, etc.) aus den TR-Dokumenten

Datenbank-Speicherung: Jede Anforderung wird als Requirement in der Compliance-DB gespeichert

✓

Audit-Workspace: Anforderungen koennen mit Implementierungsdetails angereichert werden

)} {/* Results Tab */} {activeTab === 'logs' && (

Letzte Ergebnisse

{results.length === 0 ? (

Keine Ergebnisse vorhanden. Starte einen Scrape-Vorgang.

) : (

{results.map((result, idx) => (

{result.error ? '❌' : result.reason ? '⏭️' : '✅'} {result.code} {result.error || result.reason || `${result.requirements_extracted} Anforderungen`}

))}

)}

)} {/* System Info Section */}

) } // Source Card Component function SourceCard({ source, onScrape, scraping }: { source: Source onScrape: (code: string, force: boolean) => void scraping: boolean }) { const regType = regulationTypeBadge[source.regulation_type] || regulationTypeBadge.industry_standard const srcType = sourceTypeBadge[source.source_type] || sourceTypeBadge.manual return (

{regType.icon}

{source.code} {regType.label} {srcType.label}

{source.url.length > 60 ? source.url.substring(0, 60) + '...' : source.url}

{source.has_data ? ( {source.requirement_count} Anforderungen ) : ( Keine Daten )}

{source.has_data && ( )}

) }