import type { SystemInfoConfig } from './types' export const zeugnisseCrawlerConfig: SystemInfoConfig = { title: 'Zeugnisse Crawler System-Info', description: 'Crawler fuer Zeugnisformulierungen und Bewertungstexte.', version: '1.0', privacyNotes: [ 'Nur anonymisierte Textbausteine', 'Keine personenbezogenen Daten', 'Quellennachweis fuer alle Texte', ], architecture: { layers: [ { title: 'Admin UI', components: ['Source Manager', 'Text Editor', 'Categories'], color: '#3b82f6' }, { title: 'Crawler', components: ['PDF Parser', 'Text Extractor', 'Classifier'], color: '#8b5cf6' }, { title: 'Processing', components: ['Deduplication', 'Quality Check', 'Tagging'], color: '#10b981' }, { title: 'Database', components: ['Text Corpus', 'Categories', 'Search Index'], color: '#f59e0b' }, ], }, features: [ { name: 'PDF-Parsing', status: 'active', description: 'Extraktion aus Zeugnis-PDFs' }, { name: 'Kategorisierung', status: 'active', description: 'Automatische Einordnung' }, { name: 'Qualitaetssicherung', status: 'active', description: 'Review-Workflow' }, { name: 'KI-Generierung', status: 'planned', description: 'Neue Formulierungen' }, ], roadmap: [ { phase: 'Phase 1: Corpus (Q1)', priority: 'high', items: ['PDF Import', 'Text Cleaning', 'Category System', 'Search Function'] }, { phase: 'Phase 2: Quality (Q2)', priority: 'medium', items: ['Duplicate Detection', 'Quality Scoring', 'Source Tracking', 'Review Workflow'] }, { phase: 'Phase 3: AI (Q3)', priority: 'medium', items: ['Style Analysis', 'Generation', 'Personalization', 'Compliance Check'] }, ], technicalDetails: [ { component: 'PDF', technology: 'PyMuPDF', description: 'PDF Parsing' }, { component: 'NLP', technology: 'spaCy', description: 'Text Analysis' }, { component: 'Search', technology: 'Qdrant', description: 'Semantic Search' }, { component: 'Storage', technology: 'PostgreSQL', description: 'Text Database' }, ], auditInfo: [ { category: 'Corpus Status', items: [ { label: 'Formulierungen', value: 'Tracking', status: 'ok' }, { label: 'Kategorien', value: 'Definiert', status: 'ok' }, { label: 'Qualitaet geprueft', value: 'Review', status: 'ok' }, { label: 'Letzte Aktualisierung', value: 'Woechentlich', status: 'ok' }, ], }, { category: 'Datenschutz', items: [ { label: 'Anonymisierung', value: 'Vollstaendig', status: 'ok' }, { label: 'Quellennachweis', value: 'Vorhanden', status: 'ok' }, { label: 'Keine PII', value: 'Verifiziert', status: 'ok' }, { label: 'Lizenzstatus', value: 'Geprueft', status: 'ok' }, ], }, { category: 'KI-Features', items: [ { label: 'Kategorisierung', value: 'Automatisch', status: 'ok' }, { label: 'Stilanalyse', value: 'Geplant', status: 'warning' }, { label: 'Generierung', value: 'Geplant', status: 'warning' }, { label: 'Qualitaets-Scoring', value: 'Aktiv', status: 'ok' }, ], }, ], fullDocumentation: `

Zeugnisse Crawler - Formulierungsdatenbank

1. Uebersicht

Der Zeugnisse Crawler sammelt und kategorisiert anonymisierte Zeugnisformulierungen. Er dient als Referenzdatenbank fuer die Erstellung von Arbeitszeugnissen.

2. Kategorie-System

KategorieUnterkategorienBeispiel
Leistungsehr gut, gut, befriedigend, ..."stets zur vollsten Zufriedenheit"
SozialverhaltenKollegen, Vorgesetzte, Kunden"war bei allen beliebt"
FachwissenTheorie, Praxis, Weiterbildung"verfuegt ueber fundiertes..."
ArbeitsweiseSelbstaendigkeit, Sorgfalt, ..."arbeitet aeusserst zuverlaessig"

3. API Endpoints

EndpointMethodeBeschreibung
/api/zeugnisse/searchGETFormulierungen suchen
/api/zeugnisse/categoriesGETKategorien listen
/api/zeugnisse/suggestPOSTPassende Formulierungen

4. Compliance

`, }