Files
Benjamin Boenisch 414e0f5ec0
All checks were successful
CI / go-lint (push) Has been skipped
CI / python-lint (push) Has been skipped
CI / nodejs-lint (push) Has been skipped
CI / test-go-school (push) Successful in 28s
CI / test-go-edu-search (push) Successful in 27s
CI / test-python-klausur (push) Successful in 1m45s
CI / test-python-agent-core (push) Successful in 16s
CI / test-nodejs-website (push) Successful in 21s
feat: edu-search-service migriert, voice-service/geo-service entfernt
- edu-search-service von breakpilot-pwa nach breakpilot-lehrer kopiert (ohne vendor)
- opensearch + edu-search-service in docker-compose.yml hinzugefuegt
- voice-service aus docker-compose.yml entfernt (jetzt in breakpilot-core)
- geo-service aus docker-compose.yml entfernt (nicht mehr benoetigt)
- CI/CD: edu-search-service zu Gitea Actions und Woodpecker hinzugefuegt
  (Go lint, test mit go mod download, build, SBOM)

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-02-15 18:36:38 +01:00

286 lines
5.0 KiB
YAML

# Subject (Fach) Tagging Regeln
# Format: strong (+3), weak (+1), negative (-2)
subjects:
Mathe:
strong:
- "mathematik"
- "mathe"
- "algebra"
- "geometrie"
- "stochastik"
- "analysis"
- "prozentrechnung"
- "gleichungen"
- "funktionen"
- "trigonometrie"
- "wahrscheinlichkeit"
weak:
- "zahlen"
- "terme"
- "diagramme"
- "brueche"
- "dreisatz"
- "rechnen"
negative: []
Deutsch:
strong:
- "deutschunterricht"
- "grammatik"
- "rechtschreibung"
- "aufsatz"
- "textanalyse"
- "literatur"
- "argumentation"
- "erzaehlung"
- "lyrik"
- "drama"
- "epik"
weak:
- "lesen"
- "schreiben"
- "woerter"
- "satzglieder"
negative:
- "deutschland"
- "deutsche geschichte"
Englisch:
strong:
- "englischunterricht"
- "english"
- "grammar"
- "vocabulary"
- "reading comprehension"
- "listening"
- "speaking"
weak:
- "text"
- "dialogue"
negative: []
Franzoesisch:
strong:
- "franzoesisch"
- "francais"
- "french"
- "grammaire"
weak:
- "texte"
negative: []
Latein:
strong:
- "latein"
- "lateinunterricht"
- "grammatik latein"
weak:
- "uebersetzung"
- "vokabel"
negative: []
Biologie:
strong:
- "biologie"
- "bio"
- "oekologie"
- "evolution"
- "genetik"
- "zellbiologie"
- "stoffwechsel"
- "neurobiologie"
weak:
- "zelle"
- "organismus"
- "lebewesen"
negative: []
Chemie:
strong:
- "chemie"
- "chemieunterricht"
- "organische chemie"
- "anorganische chemie"
- "reaktionsgleichung"
- "periodensystem"
weak:
- "element"
- "verbindung"
- "reaktion"
negative: []
Physik:
strong:
- "physik"
- "physikunterricht"
- "mechanik"
- "elektrizitaet"
- "optik"
- "thermodynamik"
- "quantenphysik"
weak:
- "energie"
- "kraft"
- "bewegung"
negative: []
Informatik:
strong:
- "informatik"
- "programmierung"
- "algorithmus"
- "datenstruktur"
- "python"
- "java"
- "sql"
- "netzwerke"
weak:
- "code"
- "daten"
- "computer"
negative: []
Geschichte:
strong:
- "geschichtsunterricht"
- "historisch"
- "weimarer republik"
- "nationalsozialismus"
- "mittelalter"
- "aufklaerung"
- "industrialisierung"
- "antike"
- "renaissance"
weak:
- "quelle"
- "chronologie"
- "epoche"
negative: []
Politik_Sozialkunde:
strong:
- "politik"
- "politikunterricht"
- "sozialkunde"
- "gemeinschaftskunde"
- "demokratie"
- "grundgesetz"
- "bundestag"
- "wahlen"
- "parteien"
weak:
- "rechte"
- "pflichten"
- "institutionen"
negative:
- "europaeische union" # zu allgemein
Geographie:
strong:
- "geographie"
- "geografie"
- "erdkunde"
- "topographie"
- "klimazonen"
- "plattentektonik"
weak:
- "karte"
- "landschaft"
- "kontinent"
negative: []
Religion_Ethik:
strong:
- "religionsunterricht"
- "ethik"
- "philosophie"
- "weltreligionen"
- "bibel"
- "christentum"
- "islam"
- "judentum"
weak:
- "werte"
- "moral"
negative: []
Kunst:
strong:
- "kunstunterricht"
- "bildende kunst"
- "malerei"
- "zeichnen"
- "gestaltung"
- "kunstgeschichte"
weak:
- "bild"
- "farbe"
negative:
- "kunststoff"
Musik:
strong:
- "musikunterricht"
- "musiktheorie"
- "notenlehre"
- "rhythmus"
- "harmonie"
- "instrument"
weak:
- "lied"
- "melodie"
negative: []
Sport:
strong:
- "sportunterricht"
- "bewegung sport"
- "leichtathletik"
- "ballsport"
- "turnen"
- "schwimmen unterricht"
weak:
- "spiel"
- "fitness"
negative:
- "sportlich"
- "esport"
Wirtschaft:
strong:
- "wirtschaftsunterricht"
- "oekonomie"
- "volkswirtschaft"
- "betriebswirtschaft"
- "marktwirtschaft"
weak:
- "unternehmen"
- "markt"
negative: []
Sachunterricht:
strong:
- "sachunterricht"
- "heimat- und sachunterricht"
- "hsu"
weak:
- "grundschule thema"
negative: []
DaZ_DaF:
strong:
- "deutsch als zweitsprache"
- "deutsch als fremdsprache"
- "daz"
- "daf"
- "alphabetisierung"
weak:
- "sprachfoerderung"
- "integration"
negative: []
# Threshold für Subject-Assignment
threshold: 4 # Mindest-Score um Subject zuzuweisen
max_subjects: 3 # Maximal 3 Subjects pro Dokument