Files
breakpilot-lehrer/website/components/admin/system-info-configs/zeugnisse-crawler-config.ts
Benjamin Boenisch 5a31f52310 Initial commit: breakpilot-lehrer - Lehrer KI Platform
Services: Admin-Lehrer, Backend-Lehrer, Studio v2, Website,
Klausur-Service, School-Service, Voice-Service, Geo-Service,
BreakPilot Drive, Agent-Core

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-02-11 23:47:26 +01:00

97 lines
4.4 KiB
TypeScript

import type { SystemInfoConfig } from './types'
export const zeugnisseCrawlerConfig: SystemInfoConfig = {
title: 'Zeugnisse Crawler System-Info',
description: 'Crawler fuer Zeugnisformulierungen und Bewertungstexte.',
version: '1.0',
privacyNotes: [
'Nur anonymisierte Textbausteine',
'Keine personenbezogenen Daten',
'Quellennachweis fuer alle Texte',
],
architecture: {
layers: [
{ title: 'Admin UI', components: ['Source Manager', 'Text Editor', 'Categories'], color: '#3b82f6' },
{ title: 'Crawler', components: ['PDF Parser', 'Text Extractor', 'Classifier'], color: '#8b5cf6' },
{ title: 'Processing', components: ['Deduplication', 'Quality Check', 'Tagging'], color: '#10b981' },
{ title: 'Database', components: ['Text Corpus', 'Categories', 'Search Index'], color: '#f59e0b' },
],
},
features: [
{ name: 'PDF-Parsing', status: 'active', description: 'Extraktion aus Zeugnis-PDFs' },
{ name: 'Kategorisierung', status: 'active', description: 'Automatische Einordnung' },
{ name: 'Qualitaetssicherung', status: 'active', description: 'Review-Workflow' },
{ name: 'KI-Generierung', status: 'planned', description: 'Neue Formulierungen' },
],
roadmap: [
{ phase: 'Phase 1: Corpus (Q1)', priority: 'high', items: ['PDF Import', 'Text Cleaning', 'Category System', 'Search Function'] },
{ phase: 'Phase 2: Quality (Q2)', priority: 'medium', items: ['Duplicate Detection', 'Quality Scoring', 'Source Tracking', 'Review Workflow'] },
{ phase: 'Phase 3: AI (Q3)', priority: 'medium', items: ['Style Analysis', 'Generation', 'Personalization', 'Compliance Check'] },
],
technicalDetails: [
{ component: 'PDF', technology: 'PyMuPDF', description: 'PDF Parsing' },
{ component: 'NLP', technology: 'spaCy', description: 'Text Analysis' },
{ component: 'Search', technology: 'Qdrant', description: 'Semantic Search' },
{ component: 'Storage', technology: 'PostgreSQL', description: 'Text Database' },
],
auditInfo: [
{
category: 'Corpus Status',
items: [
{ label: 'Formulierungen', value: 'Tracking', status: 'ok' },
{ label: 'Kategorien', value: 'Definiert', status: 'ok' },
{ label: 'Qualitaet geprueft', value: 'Review', status: 'ok' },
{ label: 'Letzte Aktualisierung', value: 'Woechentlich', status: 'ok' },
],
},
{
category: 'Datenschutz',
items: [
{ label: 'Anonymisierung', value: 'Vollstaendig', status: 'ok' },
{ label: 'Quellennachweis', value: 'Vorhanden', status: 'ok' },
{ label: 'Keine PII', value: 'Verifiziert', status: 'ok' },
{ label: 'Lizenzstatus', value: 'Geprueft', status: 'ok' },
],
},
{
category: 'KI-Features',
items: [
{ label: 'Kategorisierung', value: 'Automatisch', status: 'ok' },
{ label: 'Stilanalyse', value: 'Geplant', status: 'warning' },
{ label: 'Generierung', value: 'Geplant', status: 'warning' },
{ label: 'Qualitaets-Scoring', value: 'Aktiv', status: 'ok' },
],
},
],
fullDocumentation: `
<h2>Zeugnisse Crawler - Formulierungsdatenbank</h2>
<h3>1. Uebersicht</h3>
<p>Der Zeugnisse Crawler sammelt und kategorisiert anonymisierte Zeugnisformulierungen. Er dient als Referenzdatenbank fuer die Erstellung von Arbeitszeugnissen.</p>
<h3>2. Kategorie-System</h3>
<table>
<tr><th>Kategorie</th><th>Unterkategorien</th><th>Beispiel</th></tr>
<tr><td>Leistung</td><td>sehr gut, gut, befriedigend, ...</td><td>"stets zur vollsten Zufriedenheit"</td></tr>
<tr><td>Sozialverhalten</td><td>Kollegen, Vorgesetzte, Kunden</td><td>"war bei allen beliebt"</td></tr>
<tr><td>Fachwissen</td><td>Theorie, Praxis, Weiterbildung</td><td>"verfuegt ueber fundiertes..."</td></tr>
<tr><td>Arbeitsweise</td><td>Selbstaendigkeit, Sorgfalt, ...</td><td>"arbeitet aeusserst zuverlaessig"</td></tr>
</table>
<h3>3. API Endpoints</h3>
<table>
<tr><th>Endpoint</th><th>Methode</th><th>Beschreibung</th></tr>
<tr><td>/api/zeugnisse/search</td><td>GET</td><td>Formulierungen suchen</td></tr>
<tr><td>/api/zeugnisse/categories</td><td>GET</td><td>Kategorien listen</td></tr>
<tr><td>/api/zeugnisse/suggest</td><td>POST</td><td>Passende Formulierungen</td></tr>
</table>
<h3>4. Compliance</h3>
<ul>
<li><strong>Keine personenbezogenen Daten:</strong> Vollstaendig anonymisiert</li>
<li><strong>Quellennachweis:</strong> Herkunft dokumentiert</li>
<li><strong>Lizenzpruefung:</strong> Nur freie Inhalte</li>
</ul>
`,
}