870cdc871e34b19bcc6797929bc6453af1ab32d3
chunk_text_legal hatte einen Early-Return fuer text <= chunk_size, der den [§ X]-Prefix uebersprang -> chunk_text_legal_structured konnte section/article nicht extrahieren -> article="" -> (a) article_label fiel auf "BDSG" zurueck (kein §), (b) deterministische Point-ID kollidierte (alle article="" -> gleiche ID) -> ~die Haelfte kurzer §§ ueberschrieben sich. Fix: Early-Return traegt den erkannten Sektions-Header als Prefix. Belegt am BDSG-§-Ingest: 44->86 distinkte §§, §38 sauber "BDSG § 38". Wirkt nur auf KUENFTIGE Ingests (kein Re-Chunk). Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
…
…
Description
No description provided
Languages
Python
38.2%
TypeScript
37.9%
Go
18.9%
HTML
3.2%
Shell
0.7%
Other
1.1%