Services: Admin-Lehrer, Backend-Lehrer, Studio v2, Website, Klausur-Service, School-Service, Voice-Service, Geo-Service, BreakPilot Drive, Agent-Core Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
97 lines
4.4 KiB
TypeScript
97 lines
4.4 KiB
TypeScript
import type { SystemInfoConfig } from './types'
|
|
|
|
export const zeugnisseCrawlerConfig: SystemInfoConfig = {
|
|
title: 'Zeugnisse Crawler System-Info',
|
|
description: 'Crawler fuer Zeugnisformulierungen und Bewertungstexte.',
|
|
version: '1.0',
|
|
privacyNotes: [
|
|
'Nur anonymisierte Textbausteine',
|
|
'Keine personenbezogenen Daten',
|
|
'Quellennachweis fuer alle Texte',
|
|
],
|
|
architecture: {
|
|
layers: [
|
|
{ title: 'Admin UI', components: ['Source Manager', 'Text Editor', 'Categories'], color: '#3b82f6' },
|
|
{ title: 'Crawler', components: ['PDF Parser', 'Text Extractor', 'Classifier'], color: '#8b5cf6' },
|
|
{ title: 'Processing', components: ['Deduplication', 'Quality Check', 'Tagging'], color: '#10b981' },
|
|
{ title: 'Database', components: ['Text Corpus', 'Categories', 'Search Index'], color: '#f59e0b' },
|
|
],
|
|
},
|
|
features: [
|
|
{ name: 'PDF-Parsing', status: 'active', description: 'Extraktion aus Zeugnis-PDFs' },
|
|
{ name: 'Kategorisierung', status: 'active', description: 'Automatische Einordnung' },
|
|
{ name: 'Qualitaetssicherung', status: 'active', description: 'Review-Workflow' },
|
|
{ name: 'KI-Generierung', status: 'planned', description: 'Neue Formulierungen' },
|
|
],
|
|
roadmap: [
|
|
{ phase: 'Phase 1: Corpus (Q1)', priority: 'high', items: ['PDF Import', 'Text Cleaning', 'Category System', 'Search Function'] },
|
|
{ phase: 'Phase 2: Quality (Q2)', priority: 'medium', items: ['Duplicate Detection', 'Quality Scoring', 'Source Tracking', 'Review Workflow'] },
|
|
{ phase: 'Phase 3: AI (Q3)', priority: 'medium', items: ['Style Analysis', 'Generation', 'Personalization', 'Compliance Check'] },
|
|
],
|
|
technicalDetails: [
|
|
{ component: 'PDF', technology: 'PyMuPDF', description: 'PDF Parsing' },
|
|
{ component: 'NLP', technology: 'spaCy', description: 'Text Analysis' },
|
|
{ component: 'Search', technology: 'Qdrant', description: 'Semantic Search' },
|
|
{ component: 'Storage', technology: 'PostgreSQL', description: 'Text Database' },
|
|
],
|
|
auditInfo: [
|
|
{
|
|
category: 'Corpus Status',
|
|
items: [
|
|
{ label: 'Formulierungen', value: 'Tracking', status: 'ok' },
|
|
{ label: 'Kategorien', value: 'Definiert', status: 'ok' },
|
|
{ label: 'Qualitaet geprueft', value: 'Review', status: 'ok' },
|
|
{ label: 'Letzte Aktualisierung', value: 'Woechentlich', status: 'ok' },
|
|
],
|
|
},
|
|
{
|
|
category: 'Datenschutz',
|
|
items: [
|
|
{ label: 'Anonymisierung', value: 'Vollstaendig', status: 'ok' },
|
|
{ label: 'Quellennachweis', value: 'Vorhanden', status: 'ok' },
|
|
{ label: 'Keine PII', value: 'Verifiziert', status: 'ok' },
|
|
{ label: 'Lizenzstatus', value: 'Geprueft', status: 'ok' },
|
|
],
|
|
},
|
|
{
|
|
category: 'KI-Features',
|
|
items: [
|
|
{ label: 'Kategorisierung', value: 'Automatisch', status: 'ok' },
|
|
{ label: 'Stilanalyse', value: 'Geplant', status: 'warning' },
|
|
{ label: 'Generierung', value: 'Geplant', status: 'warning' },
|
|
{ label: 'Qualitaets-Scoring', value: 'Aktiv', status: 'ok' },
|
|
],
|
|
},
|
|
],
|
|
fullDocumentation: `
|
|
<h2>Zeugnisse Crawler - Formulierungsdatenbank</h2>
|
|
|
|
<h3>1. Uebersicht</h3>
|
|
<p>Der Zeugnisse Crawler sammelt und kategorisiert anonymisierte Zeugnisformulierungen. Er dient als Referenzdatenbank fuer die Erstellung von Arbeitszeugnissen.</p>
|
|
|
|
<h3>2. Kategorie-System</h3>
|
|
<table>
|
|
<tr><th>Kategorie</th><th>Unterkategorien</th><th>Beispiel</th></tr>
|
|
<tr><td>Leistung</td><td>sehr gut, gut, befriedigend, ...</td><td>"stets zur vollsten Zufriedenheit"</td></tr>
|
|
<tr><td>Sozialverhalten</td><td>Kollegen, Vorgesetzte, Kunden</td><td>"war bei allen beliebt"</td></tr>
|
|
<tr><td>Fachwissen</td><td>Theorie, Praxis, Weiterbildung</td><td>"verfuegt ueber fundiertes..."</td></tr>
|
|
<tr><td>Arbeitsweise</td><td>Selbstaendigkeit, Sorgfalt, ...</td><td>"arbeitet aeusserst zuverlaessig"</td></tr>
|
|
</table>
|
|
|
|
<h3>3. API Endpoints</h3>
|
|
<table>
|
|
<tr><th>Endpoint</th><th>Methode</th><th>Beschreibung</th></tr>
|
|
<tr><td>/api/zeugnisse/search</td><td>GET</td><td>Formulierungen suchen</td></tr>
|
|
<tr><td>/api/zeugnisse/categories</td><td>GET</td><td>Kategorien listen</td></tr>
|
|
<tr><td>/api/zeugnisse/suggest</td><td>POST</td><td>Passende Formulierungen</td></tr>
|
|
</table>
|
|
|
|
<h3>4. Compliance</h3>
|
|
<ul>
|
|
<li><strong>Keine personenbezogenen Daten:</strong> Vollstaendig anonymisiert</li>
|
|
<li><strong>Quellennachweis:</strong> Herkunft dokumentiert</li>
|
|
<li><strong>Lizenzpruefung:</strong> Nur freie Inhalte</li>
|
|
</ul>
|
|
`,
|
|
}
|