feat: Backlog 1-5 — soft-hints, chatbot-discovery, API-payload, LLM-Agent
5 Backlog-Items aus dem Multi-Site-Briefing in einem Sprint:
1. B13 B2C-Soft-Hints — Versicherungs/Tarif/Buchungs-Marker
_B2C_WEAK erweitert um "Reiseversicherung", "Tarifrechner",
"Online-Antrag", "Flug buchen", "Stromtarif" etc.
Fängt Allianz-Reise-Chatbot (vorher False-Negative).
2. Chatbot-Policy-Discovery (chatbot_policy_discovery.py)
Probt 14 Standard-Slugs (privacypolicychatbot, chatbot-datenschutz,
ai-policy, ki-datenschutz, ...) × 5 Lang-Prefixe auf jeder
submitted Origin. Successful >300-Wort-Findings werden in
doc_texts['dse'] gemerged. Audit-Trail über
doc_entries[dse].chatbot_policy_sources.
Hebt Westfield-iAdvize-Lücke.
3. API-Response-Payload erweitert
phase_f_persist.response um extra_findings, audit_walk und
html_blocks erweitert. B-Wiring-Output (B1, B3-B18) ist nicht
mehr nur im Mail-HTML versteckt — externe Aufrufer sehen jeden
Finding. Schema additiv, legacy clients ignorieren neue Felder.
4. Plausibility-LLM Empty-Response-Fix
Resilienz-Strategie A→B→C→D:
A) format='json' (strict, default)
B) format='' (loose, _try_extract_json mit ```json-fence + prose-
wrap-Unterstützung)
C) Split-Batch-Recursion (vorhanden)
D) Give up, leeres dict (callers behandeln als skipped)
Plus _post_llm() als isolierter LLM-Call-Helper, catched
Network-Errors.
5. Specialist-Agents Phase 2 LLM (MVP) — Impressum-Agent
impressum_agent_llm.py: qwen3:30b-a3b mit § 5 TMG System-Prompt,
business_scope-hints aus profile_dict. Output identisches Schema
wie pattern-agent für ein Merge ohne API-Bruch.
_b18_wiring.py orchestriert beide Agents + deduplet nach
field_id, rendert lila V2-Block mit KB/LLM-Tags pro Finding.
Pattern-first im Dedup (deterministisch + stable).
Tests: 107/107 grün (7 Test-Suites + chatbot-discovery + b18).
Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
@@ -44,6 +44,17 @@ _B2C_WEAK = (
|
||||
"shop", "store", "kaufen", "produkt", "ware", "rechnung",
|
||||
"agb", "widerrufsfrist", "widerrufsrecht", "wallbox", "hardware",
|
||||
"abonnement", "tarif buchen", "naturstrom", "ladetarif",
|
||||
# Versicherungs- / Finanz-B2C
|
||||
"reiseversicherung", "versicherung abschließen",
|
||||
"versicherung kaufen", "online abschließen", "online-antrag",
|
||||
"antrag stellen", "police", "vertrag abschließen",
|
||||
"tarifrechner", "beitrag berechnen", "jetzt online",
|
||||
# Telekom / Energie / Mobilfunk B2C
|
||||
"vertrag buchen", "tarif wechseln", "stromtarif",
|
||||
"gastarif", "mobilfunkvertrag", "dsl-tarif",
|
||||
# Reise / Hotel / Mobility B2C
|
||||
"buchen", "reservieren", "buchung", "ticket kaufen",
|
||||
"fahrkarte", "flug buchen",
|
||||
)
|
||||
|
||||
# Hard B2B-only signals that override B2C-Verdacht.
|
||||
|
||||
Reference in New Issue
Block a user