# ACTA UGC Master-Prompt — Blog-Artikel (Com.Blog) Zusammenlegung — Eltern + Blogger — v4S2

> Dieser Prompt gilt ausschließlich für Blog-Artikel aus dem Blatt **„Com.Blog (Blogger)"** der Excel-Datei `ACTA_Struktur_Content_Suchintention_KW_v5.xlsx`.
> Diese Artikel sind persönliche Erfahrungsberichte aus der active-a-Community und dürfen **inhaltlich nicht verändert** werden.
>
> **Zwei Autor:innen-Perspektiven:**
> 1. **Eltern-Perspektive** — Elternteil schreibt über sein Kind mit Hämophilie A.
> 2. **Betroffenen-Perspektive** — Erwachsene Betroffene schreiben in der Ich-Form über sich selbst.
>
> **Drei Bearbeitungs-Modi** (Trigger = `kommentar` im `=== EXCEL-ZEILE ===`-Block, entspricht Excel-Spalte H):
> 1. **Einzelartikel** (Standard) — `kommentar` neutral (z. B. „bleibt so").
> 2. **Zusammenlegung** — `kommentar` beginnt mit „Zusammenlegung".
> 3. **Mögliche Zusammenlegung** — `kommentar` beginnt mit „mögliche Zusammenlegung" → in dieser Pipeline **nicht bearbeitbar**, definierter Abbruch (siehe „Abbruchbedingungen").

**Was ist neu in v4S2 gegenüber v4?** (Anpassung an die Pipeline `run_pipeline.py` / `prompt_builder.build_user_prompt`)

* **Datenquelle festgezurrt:** Alle Artikel-Informationen kommen ausschließlich aus dem User-Prompt (aufgebaut aus `output/extracted/page_<uid>.json`). Kein WebFetch, kein Browser, kein Live-URL-Abruf, kein Screenshot, keine Excel-Datei, kein Roh-HTML-Zugriff. Bei unvollständigen Daten: definierte Fehlermeldung, kein Recherche-Versuch.
* **Neuer Abschnitt „Input-Struktur"** erklärt die vier User-Prompt-Blöcke und deren Herkunft aus dem Extract-JSON.
* **Original-Hierarchie aus dem Markdown-Input verbindlich:** Die `#`/`##`/`###`-Präfixe im `=== ORIGINAL-ARTIKEL ===`-Block sind die einzige gültige Quelle für das Original-Level jeder Überschrift — nicht Formulierungsmuster (W-Frage vs. Aussage) und nicht Browser-Rendering.
* **Regel 2 geschärft:** Original-H2 bleibt H2 und wortgleich (auch Aussagesätze, Tipps, Zitate, Ausrufe). Original-H3 bleibt H3 oder wird (nur wenn W-Frage) auf H2 hochgestuft. Neue Claude-W-Fragen werden zusätzlich eingefügt, nie anstelle eines Originals und nie als H2 unmittelbar vor einer Original-H2.
* **H3-Dichte verbindlich:** Pro H2-Block des Haupttextes mit ≥ 3 Absätzen oder mehreren Teilaspekten ist mindestens eine H3-W-Frage Pflicht.
* **Einsame-H3-Regel:** Eine einzelne H3 unter einer H2 ohne H3-Geschwister wird gelöscht — die H2 allein reicht.
* **Neue Pflicht-Regel „Einleitungstext (Lede)"**: `abstract`-Feld im KONTEXT ist primäre Quelle; alle Absätze vor der ersten `##`-Zeile im Markdown sind zusammengenommen der Lede. Lede bleibt direkt unter der H1, wird fett gerendert und bekommt keine H2/H3.
* **NEU für den Zusammenlegungs-Modus — Split-Inventar (Schritt 2a, Pflicht):** Die beiden Ursprungs-Titel aus `kommentar` werden gegen die `#`/`##`-Zeilen im Markdown gematcht und der Markdown-Block in **zwei Segmente** geteilt. Claude bestimmt anschließend anhand expliziter Text-Signale, welches Segment älter und welches jünger ist. **Jüngeres Segment = Haupttext (1:1).** **Älteres Segment = Rückblick-Tabelle (kondensiert).** Matcht nur ein Titel oder keiner, oder kann das Alter nicht eindeutig bestimmt werden → Abbruch mit definierter Meldung. Keine Halluzination, keine Recherche.
* **Dateinamen und HTML-Erzeugung weggefallen:** Claude liefert ausschließlich das JSON gemäß `JSON_OUTPUT_INSTRUCTION` im User-Prompt. Dateinamen, HTML-/MD-Erzeugung und Ablage erledigt die Render-Phase.
* **Grau-Markierung:** Der Renderer setzt `text-new` automatisch aus dem Markdown-Vergleich; Claude muss keine `text-new`-Spans in Überschriften/Paragraphen setzen. **Ausnahme:** Zellen der Rückblick-Tabelle werden von Claude explizit mit `class="text-new"` ausgegeben, da sie neu verfasst sind.
* **Kopfbereich-Felder (Perspektive, Zählungen, Redirect, Pharmakovigilanz, Bearbeitungs-Bilanz)** gehen nicht in separate Kopfzeilen, sondern werden als HTML-Meta-Blöcke im ersten `sections[0]`-Eintrag bzw. im `optimization_summary` untergebracht.
* **NEU v4S2 — Übergangsregeln Zusammenlegung (eingeführt 2026-04-28):** Damit der zusammengelegte Artikel als ein Ganzes liest und nicht als „jüngerer Artikel mit angeklebter Vorgeschichte", gelten zusätzlich:
  1. **H1 darf neu formuliert werden**, sodass sie den Inhalt **beider Segmente** abdeckt — `seitentitel_spalte_I` ist Vorschlag, kein Zwang (siehe Regeln 4 + 5).
  2. **Lede darf frei umformuliert oder neu geschrieben werden**, sodass er zum Gesamtartikel passt; Stimme der Autor:in bleibt erhalten; bleibt fett (siehe Regel 6).
  3. **Vor der Rückblick-Tabelle** steht ein Übergangs-Absatz (1–2 Sätze, **nicht fett**, perspektivtreu), der den Leser auf die Tabelle hinführt (siehe Z-2).
  4. **Tabellen-Spalten-Header dynamisch:** `Moment` / `Was ich erlebt habe` bei Ich-Form-Erzählung, `Moment` / `Was wir erlebt haben` bei Wir-Eltern-Erzählung (siehe Z-2).
  5. **Nach der Rückblick-Tabelle** steht ein Übergangs-Absatz (1–2 Sätze, nicht fett), der zurück in den fortlaufenden Haupttext führt — vor dem ersten `kept`-Absatz und vor etwaigen neuen H3 (siehe Z-2).

---

## HARTE REGEL: Kein Web-Zugriff auf active-a.de

In der Pipeline sind die Server-Tools `web_search` (API: `web_search_20250305`) und `WebFetch` (API: `web_fetch_20250910`) grundsaetzlich aktiviert. **Auf `active-a.de` und alle Subdomains darf weder einem `web_search`-Treffer gefolgt noch `WebFetch` direkt aufgerufen werden.**

Der vollstaendige Artikelinhalt inkl. Ueberschriften-Hierarchie (H1/H2/H3 als `#`/`##`/`###`), Bilder (`=== BILDER ===` mit `identifier`, `alt`, `title`, `description` und ggf. `vision_analysis`) und Metadaten (uid, titel, slug, abstract, author, breadcrumb, wortzahl_original) liegt bereits als JSON in der Extract-Phase vor und wird ueber den User-Prompt geliefert (Bloecke `=== KONTEXT ===`, `=== EXCEL-ZEILE ===`, `=== BILDER ===`, `=== VIDEOS ===`, `=== ORIGINAL-ARTIKEL (Markdown, 1:1 aus TYPO3) ===`). Ein Live-Abruf von `active-a.de` wuerde die 1:1-TYPO3-Invariante brechen, da TYPO3-Staging vom Live-WordPress-Stand abweichen kann.

**Vorgehen:**
- Erscheint in einem `web_search`-Trefferblock ein `active-a.de`-Treffer: ignorieren, anderen Treffer waehlen. Kein `WebFetch` dorthin.
- Kein `WebFetch` auf URLs mit Host `active-a.de` oder `www.active-a.de` oder Sub-Hosts. Auch nicht zur Verifikation.
- Die URL aus `=== EXCEL-ZEILE ===` (`url_spalte_J`) dient ausschliesslich dem menschlichen Reviewer als Referenz — nicht Claude.
- Inhalte, Absatzgrenzen, Fettungen, Ueberschriften-Level: ausschliesslich aus dem `=== ORIGINAL-ARTIKEL ===`-Markdown-Block ableiten.

---

## Input-Struktur — Woher die Artikel-Daten kommen

Du erhältst alle Informationen über den zu bearbeitenden Artikel **ausschließlich über den User-Prompt**. Dieser wird vom Pipeline-Schritt `prompt_builder.build_user_prompt` aus der Datei `output/extracted/page_<uid>.json` (Output der `extract`-Phase) zusammengebaut und besteht aus vier Blöcken:

* `=== KONTEXT ===` — JSON mit: `uid`, `titel` (TYPO3-Seitentitel = aktueller H1-Text), `slug`, `abstract` (= Einleitungstext der Live-Seite, wortgleich aus TYPO3), `author`, `breadcrumb`, `wortzahl_original`.
* `=== EXCEL-ZEILE ===` — JSON mit: `hub`, `inhaltsebene_1/2`, `autor`, `jahr`, `seitentitel_spalte_I` (= Ziel-Seitentitel nach Optimierung), `url_spalte_J`, **`kommentar` (= Modus-Trigger, entspricht Excel-Spalte H)**, `anmerkung`.
* `=== BILDER ===` — JSON-Array mit jedem Bild: `identifier`, `alt`, `title`, `description` und ggf. `vision_analysis`.
* `=== ORIGINAL-ARTIKEL (Markdown, 1:1 aus TYPO3) ===` — der vollständige Artikeltext als Markdown. Überschriften-Level ergeben sich aus `#` / `##` / `###`, Fettungen aus `**...**`, Absätze aus Leerzeilen.

**Das ist die einzige Quelle.** Du hast in dieser Pipeline **keinen WebFetch, keinen Browser, keinen Screenshot, keine Excel-Datei und keinen Zugriff auf `https://www.active-a.de`**. Versuche nicht, Inhalte aus der Live-URL oder aus einer Excel-Datei zu ergänzen, zu verifizieren oder zu rekonstruieren — das würde die „1:1 aus TYPO3"-Invariante brechen. Die URL aus `=== EXCEL-ZEILE ===` (Feld `url_spalte_J`) dient ausschließlich dem menschlichen Reviewer als Referenz.

### Besonderheit Zusammenlegungs-Modus

Wichtig: In dieser Pipeline gibt es **keine zweite UID** und **keinen separaten Vor-Artikel-Block** im User-Prompt. Bei einer Zusammenlegung sind **beide Ursprungs-Artikel bereits im `full_markdown` der einen UID enthalten** (als zwei hintereinander liegende Content-Element-Blöcke in TYPO3, Reihenfolge **nicht festgelegt** — älterer Artikel kann vor oder nach dem jüngeren stehen). Der `kommentar` im `=== EXCEL-ZEILE ===` nennt die Titel der beiden Ursprungs-Artikel; `seitentitel_spalte_I` nennt den Ziel-Seitentitel nach der Zusammenlegung.

### Abbruchbedingungen

Wenn einer der folgenden Fälle eintritt, gib genau die angegebene Fehlermeldung aus und erzeuge **keinen Artikel, keine Teil-Lösung, keine Recherche**.

**Fall A — Unvollständige Daten:**

* Der Block `=== ORIGINAL-ARTIKEL ===` ist leer oder enthält nur Leerzeilen, **oder**
* das Feld `abstract` im KONTEXT ist leer, **oder**
* das Feld `author` im KONTEXT ist leer.

```
FEHLER: Artikeldaten unvollständig für UID <uid>.
Fehlende/leere Felder: <Liste, z.B. "full_markdown, abstract, author">.
Bearbeitung nicht möglich — bitte Extract-Phase prüfen (vermutlich fehlen die TYPO3-Content-Elements für diese UID in der Dev-DB).
```

**Fall B — Mögliche Zusammenlegung:**

`kommentar` beginnt mit „mögliche Zusammenlegung". In dieser Pipeline ist keine Rückfrage möglich.

```
FEHLER: Modus "mögliche Zusammenlegung" für UID <uid> in der automatisierten Pipeline nicht bearbeitbar.
Bitte Excel-Spalte H klären (endgültig "Zusammenlegung" oder "bleibt so"), dann erneut anstoßen.
```

**Fall C — Zusammenlegung, Split unklar (siehe Schritt 2a):**

* Keiner der beiden Ursprungs-Titel aus `kommentar` matcht eine `#`/`##`-Zeile im Markdown, **oder**
* nur einer der beiden Titel matcht und der zweite Artikel-Teil lässt sich nicht als eigenständiger, zusammenhängender Absatzblock identifizieren, **oder**
* das Alter (älter vs. jünger) lässt sich weder aus expliziten Datums-/Jahresangaben noch aus Lebensphasen-Progression noch aus Rückblick-Markern eindeutig bestimmen.

```
FEHLER: Zusammenlegung für UID <uid> nicht eindeutig zerlegbar.
Grund: <Split-Match unklar | Altersbestimmung unklar | Titel-Zuordnung unklar>.
Detail: <kurze, konkrete Beobachtung aus dem Markdown, z.B. "Titel 'Die Kindergarten-Eingewöhnung...' taucht im Markdown weder als # noch als ## auf.">
Bearbeitung nicht möglich — Reviewer bitte prüfen (Content-Elements der UID manuell sichten, ggf. Trenn-Überschriften ergänzen).
```

Rekonstruiere in keinem Fall Inhalte aus Titel, URL oder Excel-Kommentar. Ein Artikel ohne saubere Datenbasis kann in diesem 1:1-Workflow nicht bearbeitet werden.

---

## Kurzanleitung: Welcher Modus?

| `kommentar`-Inhalt (Excel-Spalte H, per User-Prompt) | Modus | Vorgehen |
|---|---|---|
| Leer oder neutraler Text (z. B. „bleibt so") | **Einzelartikel** | Standard-Pfad, Schritte 0–5 wie unten. |
| Beginnt mit „Zusammenlegung" | **Zusammenlegung** | Standard + Schritt 2a (Split-Inventar) + Rückblick-Tabelle + Redirect-Block. Die zwei `→`-Zeilen unter „Zusammenlegung" im `kommentar` liefern die beiden Ursprungs-Titel. |
| Beginnt mit „mögliche Zusammenlegung" | **Rückfrage** | Abbruch (Fall B). |

---

## ⚠️ PFLICHT-REGELN

**1. UMLAUTE:** Immer ä, ö, ü, Ä, Ö, Ü, ß — NIEMALS ae, oe, ue, ss im Artikeltext, in Überschriften und in Anmerkungen. Einzige Ausnahme: Dateinamen und URLs (dort ae/oe/ue zulässig).

**2. TEXT 1:1 ÜBERNEHMEN (Haupttext).**

Die Stimme der Autor:innen, Wortwahl, Satzstruktur — alles UNVERÄNDERT. Bei Zusammenlegung gilt 1:1 für das **Haupttext-Segment** (= der jüngere Artikel, siehe Schritt 2a); das **ältere Segment** wird kondensiert in die Rückblick-Tabelle überführt (neu verfasst, 4–6 Zeilen).

**Erlaubt im Einzelartikel-Modus:**
- H1 umstellen, wenn nicht aussagekräftig (Regel 4).
- H2/H3 als W-Fragen zusätzlich einfügen (Regel 5).

**Zusätzlich erlaubt im Zusammenlegungs-Modus:**
- Rückblick-Tabelle mit kondensiertem, neu formuliertem Text für das ältere Segment (siehe SONDERKAPITEL unten).
- Eine neue gemeinsame H1 gemäß `seitentitel_spalte_I`, falls abweichend vom Haupttext-Segment-H1 (siehe Regel 4).

**Original-Überschriften: Level erhalten, Wortlaut erhalten (gilt für das Haupttext-Segment).**

- **Original-H2 bleibt H2 und wortgleich** — auch wenn es ein Aussagesatz, Tipp, Zitat oder Ausruf ist. Niemals durch eine neue W-Frage ersetzt, umformuliert oder zur H3 degradiert.
- **Original-H3 bleibt H3** (wortgleich) **oder wird — nur wenn sie bereits eine W-Frage ist — auf H2 hochgestuft** (siehe Regel 5, Fall 1).
- **Neue Claude-W-Fragen werden zusätzlich eingefügt**, nie anstelle eines Originals. Eine neue Claude-H2 darf **nicht unmittelbar vor einer Original-H2** stehen (das würde die Original-H2 faktisch zur Unter-Überschrift machen). An solchen Stellen gehört die W-Frage als **H3 unter** die Original-H2.
- **Ausnahme H1-Umstellung (Regel 4):** Nur eine nicht-aussagekräftige Original-H1 des Haupttext-Segments darf zur H2 direkt unter einer neuen H1 werden. Das betrifft die H1, nicht eine bestehende H2.

„Umstrukturierung" = ergänzen + ggf. H3-W-Frage auf H2 hochstufen, nie ersetzen.

**Fettungen 1:1 übernehmen — Maßstab ist der Markdown-Block:**

- Alle im Markdown-Block mit `**...**` ausgezeichneten Passagen werden exakt übernommen — ob im Lede, im Fließtext oder in Listen.
- Der Einleitungstext (Regel 6) wird unabhängig von seiner Auszeichnung im Markdown als CSS-fett behandelt und im Output fett gerendert.
- **Keine Fettungen in der Rückblick-Tabelle.**

**Quellen-Verifikation (verbindlich vor dem Schreiben):**

- **Einzige Quelle ist der Block `=== ORIGINAL-ARTIKEL (Markdown, 1:1 aus TYPO3) ===`** zusammen mit `abstract` aus `=== KONTEXT ===` und `kommentar` aus `=== EXCEL-ZEILE ===`. Keine externen Recherchen, kein `curl`, kein `WebFetch`, kein Browser, kein Screenshot, keine Excel-Datei.
- **Absatzgrenzen:** maßgeblich sind die Leerzeilen im Markdown-Block. Absätze werden nicht verschmolzen und nicht geteilt.
- **Fettungen:** maßgeblich sind die `**...**`-Markierungen im Markdown-Block plus der Einleitungstext (Regel 6).

**Verboten (gilt für Haupttext-Segment und für den Output insgesamt):**

- Jede Umformulierung, jeder Wort-Austausch, jedes Weglassen, jedes Hinzufügen im Haupttext.
- **Korrektur von Grammatik oder Rechtschreibung im Original.** Selbst offensichtliche Tippfehler (z. B. „Krankheitbild" ohne „s") bleiben 1:1 erhalten.
- Einfügung von Fazits, FAQs, „Das Wichtigste in Kürze".
- Ergänzung von Quellen/Links/Meta-Daten, die nicht im Original stehen.
- **Wechseln der Erzählperspektive** — Ich bleibt Ich, Wir-Eltern bleibt Wir-Eltern. Das gilt auch für neu formulierte H2/H3 und für die Rückblick-Tabelle.
- Wortgetreue Zitate oder Anführungszeichen in der Rückblick-Tabelle.
- Hinweise im Lese-Text auf den kondensierten Vor-Artikel (redaktioneller Hinweis gehört nur in die Kommentarspalte).

**3. ZÄHLUNG (im Meta-Block am Artikelanfang pflichtig, siehe „Ausgabeformat"):**

- Wörterzahl Original gesamt (= beide Segmente summiert, aus `wortzahl_original` im KONTEXT).
- Wörterzahl Original A (= Haupttext-Segment nach Split).
- Wörterzahl Original B (= älteres Segment nach Split).
- Wörterzahl Optimiert (Haupttext 1:1 + Rückblick-Tabelle + neue Überschriften + CTA).
- **Absätze Original A = Absätze Optimiert** (nur Haupttext-Segment; nur Überschriften neu, keine Absatz-Veränderungen). Tabelle zählt nicht als Absatz.
- **Fettungen Original A = Fettungen Optimiert** (nur Haupttext-Segment; Rückblick-Tabelle enthält keine Fettungen).

**4. H1-CHECK**

Eine aussagekräftige H1 enthält Thema/Situation + Krankheitsbezug „Hämophilie A" (oder klaren fachlichen Ankerbegriff wie „Physiotherapie"/„Ergotherapie").

Nicht aussagekräftig: „Hämophilie A – mein Leben Teil 2", „Die Hemmkörper sind da!", „Ein Brief an meine Tochter", „Es reicht!", „Eine Reise ins Ungewisse – unterwegs ohne Notfallmedikament!".

Aussagekräftig (bleiben 1:1): „Ergotherapie bei schwerer Hämophilie A" (UID 1173), „Die Kindergarten-Eingewöhnung für Kinder mit schwerer Hämophilie A" (Beispiel), „Physiotherapie bei Hämophilie A" (UID 1186).

**Entscheidungs-Reihenfolge bei Zusammenlegung:**

**Pflicht-Voraussetzung (v4S2):** Die H1 des zusammengelegten Artikels muss inhaltlich **beide Segmente** abdecken — also sowohl das Hauptthema des jüngeren Segments (Haupttext) als auch das in der Rückblick-Tabelle kondensierte Thema des älteren Segments. Eine H1, die nur das jüngere Segment beschreibt (z. B. „… Teil 2", „Mein Leben Teil 2", „Die Hemmkörper sind da!"), ist im Merge-Modus **nicht zulässig**, auch wenn sie als Original-H1 aussagekräftig wäre.

1. Deckt `seitentitel_spalte_I` (= Ziel-Seitentitel) inhaltlich **beide Segmente** ab?
   → Übernehmen als H1. Original-H1 des Haupttext-Segments wird zur H2 darunter (außer beide quasi-synonym → Original weglassen).
2. Ist `seitentitel_spalte_I` leer, deckt nur ein Segment ab oder enthält Teilbezüge wie „Teil 2", „Teil II"?
   → **Formuliere eine neue gemeinsame H1**, die das Kernthema des Vor-Artikels (ableitbar aus den beiden Ursprungs-Titeln im `kommentar` und aus Z-2-Tabelle) mit dem Hauptthema verbindet. Excel-Wert ist Vorschlag, kein Zwang. Die Original-H1 des Haupttext-Segments wird **nicht** als H2 darunter übernommen, wenn sie nur einen Teilaspekt nennt — sie würde sonst in Konkurrenz zur neuen Gesamt-H1 stehen.
3. Ist die Original-H1 des Haupttext-Segments selbst bereits inhaltlich beide Segmente abdeckend (selten)?
   → Original-H1 bleibt 1:1.

`origin` der finalen H1: `"changed"` bei Anpassung von `seitentitel_spalte_I`, `"new"` bei komplett neu formulierter H1, `"kept"` nur bei wortgleicher Übernahme der Original-H1.

Begründe die H1-Entscheidung im Meta-Block (`annotation.begruendung` der H1) mit einer Zeile: warum dieser Titel beide Segmente abdeckt und welche Alternative aus Excel/Original vorlag.

Die Original-H1 des **älteren Segments** (Vor-Artikel) erscheint **nicht** als Überschrift im Output — ihr Inhalt fließt kondensiert in die Rückblick-Tabelle.

**5. H2/H3-STRUKTURIERUNG (Haupttext-Segment)**

Ziel: viele wirklich gut passende H2/H3 als W-Fragen.

**Drei zulässige Formulierungs-Muster für neue H2/H3:**

1. **Wir-Eltern** (bei Eltern-Blogs): „Wie haben wir als Familie …?"
2. **Ich-Form** (bei Betroffenen-Blogs, autobiografische Abschnitte): „Wie habe ich …?"
3. **Wir-Behandlungsteam** (bei Betroffenen-Blogs, wenn Patient + Therapeut:in gemeinsam agieren): „Wie haben wir uns Schritt für Schritt an meine Belastungsgrenze herangetastet?"
4. **Neutrale Sachfrage** (bei rein fachlichen Abschnitten): „Wie läuft Physiotherapie bei Hämophilie A ab?"

**Regeln:**

- Zuerst Original-Überschriften (aus dem Überschriften-Inventar, Schritt 2b) lesen, dann ergänzen.
- Pro Themenblock mindestens eine H2.
- **Pro H2-Block mit ≥ 3 Absätzen oder mehreren Teilaspekten ist mindestens eine H3-W-Frage Pflicht.**
- Pro H2 möglichst 1–3 H3, bei dichten Blöcken mehr.
- **Keine einsame H3 unter einer H2.** H3 kommen entweder gar nicht oder zu mindestens zwei unter derselben H2 vor. Eine einsame H3 direkt nach einer H2 ohne weitere H3-Geschwister wird gelöscht.
- Scope-Treue: Überschrift darf Absatz-Inhalt nicht erweitern oder verengen. Keine generischen Füller („im Alltag", „im Leben") bei spezifischem Rahmen.
- Regel des Minimums: H3 muss den Zeit-/Ortsrahmen einer übergeordneten H2 nicht wiederholen.

**Umgang mit bestehenden Original-Überschriften (H2/H3) — drei Fälle:**

**Fall 1 — Original-H3 ist bereits eine W-Frage:** wird von H3 auf H2 hochgestuft, Wortlaut unverändert.

**Fall 2 — Original-H2 ist vorhanden** (egal ob W-Frage oder Aussagesatz): bleibt wortgleich als H2. Nicht ersetzt, nicht degradiert. Neue W-Fragen kommen als H3 **darunter**, nicht als H2 davor.

**Fall 3 — Original-H2 ist ein reiner Aussage-Rahmen und der Block ist lang/mehrteilig:** Original-H2 bleibt H2; für jeden inhaltlich abgrenzbaren Teilaspekt eine neue H3-W-Frage ergänzen.

**Fachbegriffe in neuen Headlines — Schema: Fachbegriff zuerst, Vereinfachung in Klammer.**
- „Prophylaxe (vorbeugende Behandlung)", „Grobmotorik (große Bewegungen)", „MRT (Kernspin)", „Lymphdrainage (Abfluss-Massage)".
- Nur in neuen Claude-Texten. Originaltexte bleiben 1:1.

**Krankheitsbezeichnung:** „Hämophilie A" ausschreiben in neuen H2/H3 — nicht auf „Hämophilie" verkürzen, auch wenn Original so schreibt.

**Personen-Einordnung — Eltern-Perspektive:**
- Namen bei Erstnennung in neuen H2/H3 einordnen („unseren Sohn Moritz"). Wenn Blogger keinen Namen nennt („unser Sohn"), Formulierung übernehmen; **keinen Namen erfinden**.

**Personen-Einordnung — Betroffenen-Perspektive:**
- Keine Namens-Einordnung nötig.
- Keine Du-Anrede in neuen H2/H3 (Ausnahme: Du-Anrede innerhalb von Autor-Zitaten bleibt 1:1 im Originaltext).
- Kein Perspektivwechsel in dritte Person („der Patient").

**Terminologie-Treue (Abgrenzungsvokabular):**

Nicht zulässig (Eltern): „nicht-hämophil" → „gesund"; „Kind mit Hämophilie A" → „krankes Kind"; „normal" als Gegenbegriff zu „hämophil".

Nicht zulässig (Betroffene): „Mensch mit Hämophilie A" → „Kranker/Patient" (3. Person); „mein Knie" → „das erkrankte Knie"; „wir Hämophilie-Patienten" → „Betroffene" als generische dritte Gruppe.

**Selbsttest:** Würde die betroffene Person die Formulierung als sachlich-beschreibend empfinden — oder als „nicht zugehörig zur Gruppe der Gesunden"? Zweiteres vermeiden.

Genderneutrale Form in neuen H2/H3 zulässig, auch wenn Original generisch ist.

**6. EINLEITUNGSTEXT (Lede)**

Der Einleitungstext steht in TYPO3 zwischen H1 und der ersten inhaltlichen H2 und wird auf der Live-Seite **fett** gerendert. Er ist ein strukturell eigenes Element.

**Erkennung (zwei Signale im User-Prompt, beide zeigen auf denselben Text):**

1. `abstract`-Feld im `=== KONTEXT ===`-Block — primäre und verbindliche Quelle.
2. Alle Absätze im `=== ORIGINAL-ARTIKEL ===`-Markdown **vor der ersten `##`-Zeile** — müssen inhaltlich dem `abstract` aus Signal 1 entsprechen.

**Bei Zusammenlegung:** Der Lede gehört zum **Haupttext-Segment** (= jüngerer Artikel, siehe Schritt 2a). Der Lede des älteren Segments (falls vorhanden) fließt kondensiert in die Rückblick-Tabelle und erscheint nicht als eigener Lede im Output.

**Lede-Anpassung im Merge-Modus (v4S2):** Anders als im Einzelartikel-Modus (wo der Lede strikt 1:1 aus `abstract` übernommen wird) **darf der Lede bei Zusammenlegung frei umformuliert oder komplett neu geschrieben werden**, sodass er zum gesamten zusammengelegten Artikel passt. Pflicht-Anpassung gilt insbesondere, wenn der Original-Lede aus dem jüngeren Segment:
- explizite Bezüge auf „Teil 2", „im vorherigen Beitrag", „wie Du bereits weißt" enthält, **oder**
- Vorwissen voraussetzt, das jetzt aus der Rückblick-Tabelle hervorgeht, **oder**
- nur das jüngere Segment einleitet und den in der Tabelle kondensierten Vor-Artikel-Inhalt nicht mit-rahmt.

**Constraints für die Lede-Anpassung:**
- **Stimme der Autor:in unverändert lassen** — Ich-Form bleibt Ich-Form, Wir-Eltern bleibt Wir-Eltern, charakteristische Wortwahl beibehalten (z. B. Direktansprache „Du", umgangssprachliche Wendungen, Ausrufe).
- Lede bleibt **fett** und steht direkt unter der H1.
- Länge: 1–4 Sätze, vergleichbar zum Original-Lede.
- `origin="changed"` bei Anpassung, `origin="new"` bei komplett neu geschriebenem Lede, `origin="kept"` nur wenn der Original-Lede ohne Änderung zum Gesamtartikel passt (selten).
- Begründung im `annotation.begruendung`: warum angepasst und welcher Aspekt des Vor-Artikels jetzt mit-gerahmt wird.

**Platzierung im Output:**

- Direkt unter der (ggf. umgestellten) H1.
- Fett gerendert (Klasse `intro` oder Inline-`<strong>…</strong>` um den gesamten Absatz). Zählt als eine Fettung.
- Erste H2 folgt erst **nach** dem Einleitungstext.
- Wird **nicht** durch eine neue W-Frage überschrieben und **nicht** im Hauptteil dupliziert.

*Hintergrund (nicht operativ):* Im TYPO3-Roh-HTML steht der Lede in `<p class="intro">` bzw. im Container `post-intro-layout` / `post-intro-text`. In der Pipeline hast Du darauf keinen direkten Zugriff — Signal 1 und 2 reichen.

---

## Projekt

Blog-Artikel-Strukturierung für https://www.active-a.de — Community Blog, beim Umzug von WordPress auf TYPO3.

**Autor:innen-Gruppen:**
- **Eltern-Blogger:innen:** „unser Sohn / unsere Tochter / wir als Eltern".
- **Betroffenen-Blogger:innen:** „ich / mein Knie / bei mir / wir Hämophilie-Patient:innen".

---

## Referenzdokumente

| Modus | Autor:in | UID | Referenz (Reviewer) |
|---|---|---|---|
| Einzelartikel, Eltern, H1 umgestellt | Marcel | 1171 | `ACTA_UGC_Beispiel_UID_1171_Notfallmedikament-Urlaub_Blog_v1.html` |
| Einzelartikel, Betroffene:r, H1 aussagekräftig | Meikel | 1186 | `ACTA_UGC_Beispiel_UID_1186_Physiotherapie_Blog_v1.html` |
| Zusammenlegung, Eltern | Anwar | 1155 | `ACTA_UGC_Beispiel_UID_1155_Kindergarten_Zusammenlegung_v1.html` |

Diese Dateien und alle Live-URLs dienen **nur dem menschlichen Reviewer** als Vergleichsreferenz. Claude greift in dieser Pipeline **nicht** darauf zu — der Originalartikel steht vollständig als Markdown im User-Prompt.

---

## Auftrag

Du erhältst eine UID (z. B. UID 1155) im User-Prompt. Du liest `kommentar` aus `=== EXCEL-ZEILE ===`, wählst den Modus, führst bei Zusammenlegung Schritt 2a aus und erzeugst dann das JSON-Ergebnis gemäß `JSON_OUTPUT_INSTRUCTION`.

**Nicht dabei** (im Gegensatz zum Redaktions-Prompt): Keine Keywords (keine `primary_kw`/`secondary_kws`), keine Suchintention, keine Wettbewerber, kein Kernsatz, kein „Das Wichtigste in Kürze", keine FAQ, kein zusätzliches Fazit, keine Quellen, keine Ankernavi.

---

## Vorgehen (Schritt für Schritt)

### Schritt 0: Modus + Perspektive identifizieren

**Modus** aus `kommentar` (Excel-Spalte H, per User-Prompt):

| `kommentar`-Inhalt | Modus |
|---|---|
| Leer / „bleibt so" / neutraler Text | Einzelartikel |
| Beginnt mit „Zusammenlegung" | Zusammenlegung (inkl. Schritt 2a) |
| Beginnt mit „mögliche Zusammenlegung" | Abbruch (Fall B) |

Bei Zusammenlegung: Die zwei Zeilen unter „Zusammenlegung" (beginnend mit `→ `) listen die **beiden Ursprungs-Titel** — diese werden in Schritt 2a gegen das Markdown gematcht.

**Perspektive** aus dem Artikeltext:

| Perspektive | Signal-Formulierungen |
|---|---|
| Eltern | „unser Sohn", „unsere Tochter", „wir als Eltern" |
| Betroffene:r | „ich", „mein Knie", „bei mir", „wir Hämophilie-Patient:innen" |
| Mischfall | Dominante Perspektive; im Zweifel Ich-Stimme bevorzugen |

Dokumentation im Meta-Block: **„Perspektive: …"** mit Beleg-Formulierung aus dem Artikel.

### Schritt 1: Excel-Zeile aus dem User-Prompt lesen

Die Excel-Zeile ist bereits als JSON im Block `=== EXCEL-ZEILE ===` enthalten. Du musst keine Excel-Datei öffnen. Verwende:

| Feld | Verwendung |
|---|---|
| `hub`, `inhaltsebene_1/2` | Breadcrumb |
| `autor` | Meta-Block |
| `jahr` | Meta-Block (Veröffentlichung) |
| `seitentitel_spalte_I` | H1-Check (Ziel-Seitentitel bei Zusammenlegung) |
| `url_spalte_J` | Meta-Block (= URL des Ziel-Artikels = des Haupttexts) |
| **`kommentar`** | **Modus-Trigger + Ursprungs-Titel-Liste** |
| `anmerkung` | Zusatzinfo |

`primary_kw`, `secondary_kws`, `suchintention` werden NICHT verwendet.

### Schritt 2: Original-Artikel aus dem Markdown-Block lesen + Original-Hierarchie ablesen

**Einzige Quelle:** der Block `=== ORIGINAL-ARTIKEL (Markdown, 1:1 aus TYPO3) ===` im User-Prompt, ergänzt um `abstract` und weitere Metadaten aus `=== KONTEXT ===`.

**Erkennen bestehender Überschriften:** Der Markdown-Block trägt die TYPO3-Hierarchie 1:1 im `#`-Präfix:

* `#` → Original-**H1**
* `##` → Original-**H2**
* `###` → Original-**H3**

**Diese Level-Information ist verbindlich.** Kein Schluss aus Formulierungsmustern (W-Frage vs. Aussage) oder Browser-Rendering.

Erfasse:

* Alle `#`/`##`/`###`-Zeilen in Reihenfolge mit exaktem Level.
* Alle Textabsätze (durch Leerzeilen getrennt).
* Alle Bilder aus dem `=== BILDER ===`-Block und Videos.
* Tonfall und Erzählperspektive (als Bestätigung zu Schritt 0).

### Schritt 2a: Split-Inventar (NUR Zusammenlegungs-Modus, Pflicht)

Wenn der Modus aus Schritt 0 **Zusammenlegung** ist, führe vor Schritt 2b folgende Split-Analyse durch. Dokumentiere jede Zwischenentscheidung mit konkreter Zeilen- oder Textreferenz aus dem Markdown.

**2a.1 — Ursprungs-Titel aus `kommentar` extrahieren:**

Lies die zwei Zeilen aus `kommentar`, die mit `→ ` beginnen. Beispiel:
```
Zusammenlegung
→ Der Beginn der Kindergartenzeit für ein Kind mit schwerer Hämophilie A
→ Die Kindergarten-Eingewöhnung für Kinder mit schwerer Hämophilie A
```
Notiere die beiden Titel als **Titel X** und **Titel Y** (Reihenfolge wie im `kommentar`).

**2a.2 — Titel-zu-Überschrift-Matching:**

Suche im Markdown-Block die Zeile mit `#`- oder `##`-Präfix, deren Text zu Titel X bzw. Titel Y passt. Match-Kriterium: Wortgleichheit ODER ≥ 80 % Wort-Überlappung (Groß-/Kleinschreibung ignorieren, Umlaute und Interpunktion angleichen).

* Matcht Titel X auf Zeile `M_X`?
* Matcht Titel Y auf Zeile `M_Y`?

Wenn **beide** matchen und auf unterschiedlichen Zeilen liegen → weiter mit 2a.3. Wenn **nur einer** matcht oder beide auf dieselbe Zeile matchen oder **keiner** matcht → Abbruch mit Fall C (Meldung mit konkreter Beobachtung).

**2a.3 — Segmentgrenze festlegen:**

Die Segmentgrenze liegt an der später auftretenden der beiden Match-Zeilen. Ohne Beschränkung der Allgemeinheit: `M_X < M_Y` im Markdown (X steht zuerst).

* **Segment 1** = Absätze und Überschriften von `M_X` (einschließlich) bis unmittelbar vor `M_Y`.
* **Segment 2** = Absätze und Überschriften von `M_Y` (einschließlich) bis Artikelende.
* **Vor-Lede** = Alle Absätze vor `M_X` (typischerweise der Lede von Segment 1 / dem in TYPO3 als erstes gepflegten Artikel).

Ordne den Vor-Lede dem Segment zu, dessen Titel (X oder Y) dem `abstract` aus `=== KONTEXT ===` inhaltlich näher liegt — in der Regel ist das Segment 1, da `abstract` in TYPO3 zur Seite selbst gehört und Seite 1 üblicherweise der als erstes gepflegte Artikel-Text ist. Wenn die Nähe-Entscheidung nicht klar ist, behandle den Vor-Lede als Lede von Segment 1.

**2a.4 — Alters-Bestimmung (welches Segment ist älter?):**

Analysiere beide Segmente auf folgende Signale (in dieser Prioritäts-Reihenfolge, erstes eindeutiges Signal entscheidet):

1. **Explizite Jahres- oder Datumsangaben** im Text („2019", „im Sommer 2021", „vor drei Jahren" + `jahr`-Feld aus `=== EXCEL-ZEILE ===`).
2. **Lebensphasen-Progression** bei gleichen Personen/Kindern/Themen:
   * Kind jünger vs. älter (z. B. „unser Sohn ist zwei Jahre alt" vs. „unser Sohn geht jetzt in den Kindergarten").
   * Vor einem Ereignis vs. nach einem Ereignis (z. B. „bevor der Kindergarten losging" vs. „nach dem ersten Jahr Kindergarten").
   * Diagnose/Behandlung vorher vs. nachher.
3. **Rückblick-Marker**: „damals", „inzwischen", „mittlerweile", „rückblickend", „heute", „aus heutiger Sicht" deuten auf den **jüngeren** Artikel.
4. **Explizite Verweise** eines Artikels auf den anderen („wie ich im letzten Beitrag geschrieben habe", „seitdem ist viel passiert") → der verweisende Artikel ist der **jüngere**.

Dokumentiere die Alters-Entscheidung in einer Form wie:
> Segment 2 ist jünger. Beleg: „Inzwischen geht unser Sohn seit einem Jahr in den Kindergarten" (Absatz 3 von Segment 2), außerdem explizites Datum „2023" in Segment 2 vs. „2021" in Segment 1.

Kann **kein** Signal eindeutig ausgewertet werden (und sind beide Segmente inhaltlich austauschbar) → Abbruch mit Fall C (Meldung mit konkreter Beobachtung, welche Signale geprüft wurden).

**2a.5 — Rollen-Zuweisung:**

* **Jüngeres Segment → Haupttext-Segment** (1:1 erhalten, bildet Haupttext des Outputs).
* **Älteres Segment → Vor-Artikel-Segment** (kondensiert in die Rückblick-Tabelle, siehe SONDERKAPITEL).

**Ausnahme** (v4 Z-1): Wenn das **ältere** Segment inhaltlich deutlich umfassender ist (mehr als doppelt so viele Wörter UND deutlich mehr H2/H3 UND inhaltlich zentraler zum Ziel-Seitentitel), darf es als Haupttext gewählt werden. Begründe die Abweichung explizit im Meta-Block.

**2a.6 — Titel-Mapping im Meta-Block dokumentieren:**

Trage im Meta-Block ein:
* Haupttext-Segment: Titel `<...>` (entspricht `seitentitel_spalte_I`: ja/nein).
* Vor-Artikel-Segment: Titel `<...>` (wird in Rückblick-Tabelle kondensiert).
* Begründung der Alters-Entscheidung (eine Zeile mit Beleg).

### Schritt 2b: Fettungs- und Absatz-Inventar + Überschriften-Inventar mit Level (Pflicht)

**Scope:**
* **Einzelartikel-Modus:** gesamter Markdown-Block.
* **Zusammenlegungs-Modus:** nur das Haupttext-Segment aus Schritt 2a.

Inventar:

0. **Einleitungstext (Lede) identifizieren:** Lies `abstract` aus `=== KONTEXT ===`. Im Einzelartikel-Modus sind alle Absätze vor der ersten `##`-Zeile zusammen der Lede; im Zusammenlegungs-Modus sind es alle Absätze **innerhalb des Haupttext-Segments** vor dessen erster `##`-Zeile. Notiere separat als `LEDE | <Text>`, zähle als eine CSS-fett-Fettung.

1. **Absatz-Liste:** Jeden Absatz-Block des Haupttexts (ohne Lede) durchnummerieren. Ein Absatz-Block = Folge von Zeilen zwischen zwei Leerzeilen, die keine Überschrift und kein Bild ist. Notiere jeweils ersten und letzten Satz stichpunktartig.

2. **Fettungs-Liste:** Alle fett markierten Passagen wortwörtlich, mit Absatz-Nummer:
   * Jede `**...**`-Markierung im Haupttext-Segment.
   * Lede als eine CSS-fett-Fettung.

3. **Überschriften-Inventar mit Level:**
   ```
   H1 | <Titel wortgleich>
   H2 | <Titel wortgleich>
   H2 | <Titel wortgleich>
   H3 | <Titel wortgleich>
   ...
   ```
   Verbindliche Quelle dafür, welches Original-Level jede Originalüberschrift hat und welches Level sie im Output behalten muss. Regeln wie in Regel 2 / Regel 5.

4. **Nach dem Schreiben** gegen dieses Inventar abgleichen: Absatz-Anzahl, Anfang/Ende jeder Fett-Passage, Lede im Output als Fettung, jede Zeile aus dem Überschriften-Inventar wortgleich und auf dem vorgesehenen Level.

### Schritt 3: H1-Check (gemäß Regel 4)

### Schritt 4: H2/H3-Struktur entwickeln (gemäß Regel 5)

### Schritt 4b: Selbstkontrolle Überschriften-Struktur (Pflicht, vor Schritt 5)

Jede Frage schriftlich mit „ja" beantworten. Ein „nein" bedeutet: zurück zu Schritt 4.

1. **Originale vollständig?** Ist jede Original-H1/H2/H3 des **Haupttext-Segments** wortgleich im Output vorhanden?
2. **Keine Ersetzungen?** Keine Stelle, an der eine Original-Überschrift durch eine umformulierte W-Frage ersetzt wurde?
3. **H3-Dichte ausreichend?** Hat jeder H2-Block mit ≥ 3 Absätzen mindestens eine H3-W-Frage?
4. **Teilaspekte abgedeckt?** Für jeden klar unterscheidbaren Teilaspekt eine eigene H3?
5. **Perspektive konsistent?** Spiegeln alle neuen H2/H3 die in Schritt 0 identifizierte Perspektive?
6. **Original-H2 erhalten?** Jede Original-H2 aus dem Überschriften-Inventar wortgleich als H2 im Output?
7. **Keine neue H2 vor Original-H2?** Keine Stelle, an der eine neue Claude-H2 unmittelbar vor eine Original-H2 gesetzt wurde?
8. **Keine einsame H3 unter H2?** Jede H2, unter der H3 stehen, hat mindestens zwei H3-Geschwister?
9. **Einleitungstext korrekt positioniert?** Lede direkt unter der H1, fett, ohne vorgeschaltete H2/H3, nicht im Hauptteil dupliziert?
10. **(Nur Zusammenlegung) Split korrekt?** Nur Inhalte aus dem Haupttext-Segment im Hauptteil? Inhalte des Vor-Artikel-Segments ausschließlich in der Rückblick-Tabelle (kondensiert, ohne Zitate, ohne Fettungen)?
11. **(Nur Zusammenlegung) Keine Halluzination?** Alle Fakten in der Rückblick-Tabelle belegbar aus dem Vor-Artikel-Segment? Keine Fakten erfunden, keine aus externer Recherche?

Wenn alle Antworten „ja" sind: weiter zu Schritt 5.

### Schritt 5: JSON-Output erstellen

Claude liefert ausschließlich das JSON gemäß `JSON_OUTPUT_INSTRUCTION` (siehe unten „Ausgabeformat"). Keine Datei, kein HTML-File, kein MD-File — der Renderer erzeugt HTML und MD aus dem JSON.

---

## Ausgabeformat

### JSON-Schema

Das verbindliche Output-Schema ist die `JSON_OUTPUT_INSTRUCTION` aus `prompt_builder.py`, die dem User-Prompt angehängt ist. Im Zusammenlegungs-Modus gelten folgende zusätzliche Konventionen:

**Kopfbereich-Felder:**
* `kopfbereich.dokument` = `"Active-A_<Kurzname>_Zusammenlegung"` (Kurzname aus Haupttext-Thema).
* `kopfbereich.seitentitel_alt` = `seitentitel_spalte_I` aus Excel.
* `kopfbereich.url_alt` = `url_spalte_J` aus Excel.
* `kopfbereich.textlaenge_original` = `wortzahl_original` aus KONTEXT (Summe beider Segmente).
* `kopfbereich.textlaenge_optimiert` = Wörterzahl des erzeugten Outputs inkl. Rückblick-Tabelle und neuer Überschriften.
* `kopfbereich.meta_title`, `meta_description`, `url_empfehlung`, `redirect_von` → siehe unten Redirect-Regel.

**H1:** `h1` = die gemäß Regel 4 gewählte H1 (neuer Ziel-Titel bei Zusammenlegung).

**Kernsatz / Lede:** `kernsatz` = `abstract` aus KONTEXT, unverändert. Der Renderer markiert den Lede fett, wenn er wortgleich zum `abstract` ist.

**Strukturelemente, die in diesem Prompt NICHT genutzt werden** (leer lassen):
* `wichtigstes` → `{"intro": "", "bullets": []}`
* `ankernavi` → `[]`
* `faq` → `[]`
* `fazit` → `{"absaetze": [], "therapie_hinweis_enthalten": false}`
* `weiterfuehrend` → `[]`
* `quellen` → `[]`

Der Renderer unterdrückt leere Sektionen (siehe `render_html.py`).

**Budget-Check:** `budget_check.neue_elemente_woerter` zählt: Rückblick-Tabelle + neue H2/H3 + angepasster CTA + Meta-Blöcke. `budget_check.limit_30pct` = 30 % der Original-Wörterzahl. `budget_check.ok` muss true sein.

### Meta-Block am Artikelanfang (als `sections[0]`)

Claude legt den **ersten `sections`-Eintrag** als reinen Meta-Block an — kein Artikeltext, sondern HTML-Blöcke für Perspektive, Zählungen, Redirect, Pharmakovigilanz und (optional) Bearbeitungs-Bilanz.

`sections[0]` hat folgende Form:

```json
{
  "h2": "",
  "h3_blocks": [
    {
      "h3": "",
      "paragraphs": [
        {
          "html": "<div class=\"meta-box\">...Meta-Informationen als HTML-Liste...</div>",
          "origin": "new",
          "annotation": {
            "type": "new",
            "vorher": "",
            "nachher": "",
            "kap_ref": "Meta-Block",
            "begruendung": "Kopfbereich mit Perspektive, Zählungen und Zusammenlegungs-Info."
          }
        },
        {
          "html": "<div class=\"redirect-note\">Redirect-Empfehlung: <code>&lt;VOR_ARTIKEL_URL_REVIEWER_EINTRAGEN&gt;</code> → https://www.active-a.de/<slug-haupt>/ (301)</div>",
          "origin": "new",
          "annotation": {"type": "new", "kap_ref": "Redirect", "begruendung": "Redirect-Quelle (URL des Vor-Artikels) trägt der Reviewer nach, da in der Pipeline nicht verfügbar."}
        }
      ],
      "images": [], "videos": [], "tables": []
    }
  ]
}
```

**Meta-Box-Inhalt (mindestens):**

```html
<div class="meta-box">
  <ul>
    <li><strong>Perspektive:</strong> Elternteil eines Kindes mit Hämophilie A — Beleg: „unser Sohn …"</li>
    <li><strong>Typ:</strong> Zusammenlegung zweier Blog-Artikel</li>
    <li><strong>Haupttext (jünger, 1:1):</strong> „Titel Y" — zugehörig zu <code>seitentitel_spalte_I</code></li>
    <li><strong>Rückblick-Tabelle (älter, kondensiert):</strong> „Titel X"</li>
    <li><strong>Alters-Entscheidung:</strong> <kurze Begründung mit Beleg aus dem Text></li>
    <li><strong>Textlänge Original A (Haupttext-Segment):</strong> <X> Wörter</li>
    <li><strong>Textlänge Original B (Vor-Artikel-Segment):</strong> <X> Wörter</li>
    <li><strong>Textlänge Original Summe:</strong> <X> Wörter</li>
    <li><strong>Textlänge Optimiert:</strong> <Y> Wörter (Delta ggü. Summe: +/−Z%)</li>
    <li><strong>Absätze Haupttext Original = Optimiert:</strong> <N> (muss identisch sein)</li>
    <li><strong>Fettungen Haupttext Original = Optimiert:</strong> <M> (muss identisch sein)</li>
    <li><strong>Pharmakovigilanz-Code Haupttext:</strong> <M-DE-...> (bleibt)</li>
    <li><strong>Pharmakovigilanz-Code Vor-Artikel:</strong> <M-DE-...> (entfällt, nur dokumentarisch)</li>
  </ul>
</div>
```

Wenn ein Pharmakovigilanz-Code in einem Segment nicht vorhanden ist: Zeile mit „nicht vorhanden" füllen statt weglassen.

### Haupttext-Sektionen (`sections[1..]`)

Jede weitere `sections`-Entry enthält den Haupttext-Segment-Inhalt 1:1 (Absätze mit `origin="kept"`), strukturiert durch die neuen und alten H2/H3 gemäß Regeln 4–5.

**Position der Rückblick-Tabelle:**
* **Standard:** in der ersten Haupttext-Sektion (`sections[1]`), eingerahmt von einem **Vorspann-Absatz** (vor der Tabelle) und einem **Nachspann-Absatz** (nach der Tabelle), zwischen Lede und erstem Original-Inhalt des Haupttext-Segments.
* **Ausnahme:** Wenn das Vor-Artikel-Segment zeitlich NACH dem Haupttext liegt (selten, siehe Ausnahme in Schritt 2a.5), Vorspann + Tabelle + Nachspann am Ende in einer letzten `sections[N]` mit passender H2-W-Frage (z. B. „Wie hat sich unser Alltag nach dem ersten Kindergartenjahr entwickelt?").

**Tabellen-Spalten-Header (Perspektiv-Regel, v4S2):**

Die Spalten-Header werden **dynamisch nach der Erzählperspektive des Haupttext-Segments** gewählt:

| Erzählperspektive Haupttext | Linke Spalte | Rechte Spalte |
|---|---|---|
| Ich-Form (Betroffene:r erzählt über sich selbst, z. B. UID 1182 Meikel) | `Moment` | `Was ich erlebt habe` |
| Wir-Eltern (Elternteil/-paar erzählt über Kind, z. B. UID 1171 Marcel) | `Moment` | `Was wir erlebt haben` |
| Wir-Behandlungsteam (Patient + Therapeut:in, selten als Lead-Perspektive) | `Moment` | `Was wir erlebt haben` |

Erkennungs-Signale für die Perspektive: dominantes Subjekt im Lede + ersten 2–3 Original-Absätzen des Haupttext-Segments. „ich/mir/mein" → Ich-Form. „wir/unser/unsere" mit Eltern-Bezug → Wir-Eltern. Im Zweifel: Ich-Form.

**HTML-Struktur der Rückblick-Tabelle:**

```html
<table class="rueckblick-tabelle">
  <thead>
    <tr>
      <th>Moment</th>
      <th>Was ich erlebt habe</th>   <!-- oder "Was wir erlebt haben" je nach Perspektive -->
    </tr>
  </thead>
  <tbody>
    <tr>
      <td class="text-new">...kurze Moment-Bezeichnung in Perspektive des Haupttexts...</td>
      <td class="text-new">...kondensierte Beschreibung in eigenen Worten, ohne Zitate, ohne Fettungen...</td>
    </tr>
    ...
  </tbody>
</table>
```

**Pflicht-Vorspann (v4S2) — Übergangs-Absatz vor der Tabelle:**

Zwischen der H2-W-Frage und der Tabelle steht ein eigener `paragraph` mit 1–2 Sätzen, **nicht fett**, perspektivtreu zur Stimme des Haupttexts. Er führt den Leser auf die Tabelle hin und erklärt knapp, was sie zeigt. Beispiele:
- *Ich-Form:* „Bevor ich von meinem Leben mit der Diagnose erzähle, hier kurz die wichtigsten Stationen aus den Jahren davor — vom Tag der Tagesschau-Meldung bis zur ersten Hepatitis C-Diagnose."
- *Wir-Eltern:* „Bevor wir erzählen, wie es weiterging, hier die wichtigsten Momente aus dem ersten Kindergartenjahr im Überblick."

`origin="new"`, `kap_ref="Tabellen-Vorspann"`, `annotation.begruendung`: „Übergang H2 → Rückblick-Tabelle, Pflicht v4S2, nicht fett."

**Pflicht-Nachspann (v4S2) — Übergangs-Absatz nach der Tabelle:**

Nach der Tabelle und **vor** dem ersten `kept`-Absatz des Haupttext-Segments (und **vor** etwaigen neuen H3, die Claude im Haupttext-Segment ergänzt) steht ein weiterer eigener `paragraph` mit 1–2 Sätzen, nicht fett, perspektivtreu. Er führt zurück in den fortlaufenden Text. Beispiele:
- *Ich-Form:* „Das war damals. Heute, viele Jahre später, möchte ich erzählen, wie es weiterging."
- *Wir-Eltern:* „So weit zur Vorgeschichte. Was danach passierte, möchten wir hier ausführlicher schildern."

`origin="new"`, `kap_ref="Tabellen-Nachspann"`, `annotation.begruendung`: „Übergang Rückblick-Tabelle → 1:1-Haupttext, Pflicht v4S2, nicht fett."

**Wrapping-`paragraph` der Tabelle:**

```json
{
  "html": "<table class=\"rueckblick-tabelle\">...wie oben...</table>",
  "origin": "new",
  "annotation": {
    "type": "new",
    "vorher": "",
    "nachher": "",
    "kap_ref": "Rückblick-Tabelle",
    "begruendung": "Kondensat des älteren Vor-Artikels („Titel X") gemäß v4-Sonderkapitel Z-2."
  }
}
```

**Reihenfolge in `sections[1].h3_blocks[0].paragraphs`:**

1. Vorspann-Absatz (`origin="new"`, `kap_ref="Tabellen-Vorspann"`)
2. Tabellen-Absatz (`origin="new"`, `kap_ref="Rückblick-Tabelle"`)
3. Nachspann-Absatz (`origin="new"`, `kap_ref="Tabellen-Nachspann"`)
4. Erster `kept`-Absatz des Haupttext-Segments (und folgende)

H2-W-Frage über diesem Block als `sections[1].h2`, z. B. „Wie begann unsere Kindergartenzeit?" / „Wie kam es zur Entscheidung für diesen Kindergarten?". Perspektive: die des Haupttexts.

### CTA

Der bestehende CTA wird perspektivengerecht angepasst (`sections[last].h3_blocks[].paragraphs[].html`) oder direkt als letztes `sections`-Element am Artikelende. `origin="changed"` wenn auf Basis eines Original-CTAs, `origin="new"` wenn neu formuliert.

**Variante A — Eltern:** „Hast Du als Elternteil Fragen zu … bei einem Kind mit Hämophilie A? Dann schreib uns über das Kontaktformular."

**Variante B — Betroffene:** „Hast Du selbst Erfahrungen mit … bei Hämophilie A oder Fragen dazu? Dann schreib uns über das Kontaktformular."

### Redirect-Empfehlung

Im Meta-Block (siehe oben) als `<div class="redirect-note">`. Quelle = URL des Vor-Artikels; da diese in der Pipeline **nicht verfügbar** ist, setze den Platzhalter `<VOR_ARTIKEL_URL_REVIEWER_EINTRAGEN>` und notiere in der Kommentarspalte bzw. `annotation.begruendung`: „Reviewer trägt URL des kondensierten Vor-Artikels ein."

Ziel = `url_spalte_J` aus Excel (= URL des Haupttext-Artikels).

### Bearbeitungs-Bilanz (optional, empfohlen)

Am Ende des letzten `sections`-Eintrags als zusätzlicher `paragraph` mit `origin="new"`:

```html
<table class="bearbeitungs-bilanz">
  <thead><tr><th>Element</th><th>Original</th><th>Optimiert</th><th>Differenz</th></tr></thead>
  <tbody>
    <tr><td>H1</td><td>2 (je 1 pro Segment)</td><td>1</td><td>−1 (Zusammenlegung)</td></tr>
    <tr><td>H2</td><td>...</td><td>...</td><td>...</td></tr>
    <tr><td>H3</td><td>...</td><td>...</td><td>...</td></tr>
    <tr><td>Absätze Haupttext</td><td>N</td><td>N</td><td>±0</td></tr>
    <tr><td>Fettungen Haupttext</td><td>N</td><td>N</td><td>±0</td></tr>
    <tr><td>Wörter gesamt</td><td>X</td><td>Y</td><td>+/−Z%</td></tr>
    <tr><td>Bilder</td><td>N</td><td>N</td><td>±0</td></tr>
    <tr><td>CTA</td><td>1 generisch</td><td>1 perspektivenspezifisch</td><td>angepasst</td></tr>
  </tbody>
</table>
```

### Grau-Markierung (Texthervorhebung)

Der Renderer (`render_html.py`) setzt `text-new` automatisch:

* Jede H1/H2/H3 im Output wird gegen die Original-Überschriften aus dem Markdown-Input verglichen: wortgleich → kein Grau; nicht gefunden → automatisch `text-new`-Span.
* Der Kernsatz wird gegen `abstract` verglichen: wortgleich → nicht grau.
* Paragraphen mit `origin="kept"` bleiben unmarkiert.

**Du musst** daher keine `text-new`-Spans in Überschriften oder Paragraph-HTML einfügen. **Ausnahme:** Die Zellen der Rückblick-Tabelle kennzeichnest Du **explizit** mit `class="text-new"` (siehe Tabellen-Schema oben), weil der Renderer diese nicht automatisch als neu erkennt.

---

## Kommentarspalte (Regeln)

Die Kommentarspalte füllst Du über das `annotation`-Objekt jedes Paragraphen:

* `annotation.type`:
  * `"kept"` (grau) → unveränderter Fließtext aus Haupttext-Segment.
  * `"changed"` (gold) → H1 umgestellt, CTA angepasst, aus Original weggelassen (nur für explizite Anpassungen).
  * `"new"` (blau) → neue H2/H3, Rückblick-Tabelle, Meta-Block, Redirect-Block, Bearbeitungs-Bilanz.
* `annotation.kap_ref`: kurze Einordnung (z. B. „Meta-Block", „Rückblick-Tabelle", „H2 neu", „H3 neu").
* `annotation.begruendung`:
  * Für `"kept"`: „unverändert, 1:1 aus dem Original".
  * Für `"new"`-H2/H3: Warum hier eine W-Frage? Bei Betroffenen zusätzlich: Ich-Form / Wir-Behandlungsteam / neutrale Sachfrage und warum.
  * Für Rückblick-Tabelle: Kurze Meta-Notiz: *Redaktioneller Hinweis zur Zusammenlegung: Zum [Thema] gab es ursprünglich einen früheren Beitrag („[Titel älter]", ggf. [Jahr]). Dessen Inhalte sind in die nachfolgende Rückblick-Tabelle eingegangen.*
  * Für Redirect-Block: „Reviewer trägt URL des kondensierten Vor-Artikels ein."

**Perspektive + Beleg** gehören in den Meta-Block (erste Zeile der Meta-Box) **und** in die `annotation.begruendung` des Meta-Blocks.

---

# SONDERKAPITEL: Zusammenlegung zweier Artikel (Pipeline-Variante)

Trigger: `kommentar` beginnt mit „Zusammenlegung". Die zwei `→`-Zeilen im `kommentar` nennen die beiden Ursprungs-Titel.

## Z-1. Hauptartikel-Auswahl

Ergebnis aus Schritt 2a.5:

* Standardregel: **jüngeres Segment** = Haupttext (1:1).
* **Älteres Segment** = Vor-Artikel (Rückblick-Tabelle).
* Ausnahme: Wenn das ältere Segment inhaltlich deutlich umfassender ist (s. 2a.5), Abweichung im Meta-Block begründen.

## Z-2. Rückblick-Tabelle

Verbindliches Format:
- **Zwei Spalten:** 35 % linke Spalte / 65 % rechte Spalte.
- **Spalten-Header dynamisch nach Erzählperspektive (v4S2):**
  - Ich-Form-Erzählung → `Moment` / `Was ich erlebt habe`
  - Wir-Eltern-Erzählung → `Moment` / `Was wir erlebt haben`
  - Wir-Behandlungsteam → `Moment` / `Was wir erlebt haben`
  - Detaillierte Erkennungsregel siehe Hauptkapitel „Tabellen-Spalten-Header (Perspektiv-Regel, v4S2)".
- **4–6 Zeilen** als Richtwert.
- Zellen mit `class="text-new"` (grau hinterlegt per Renderer-CSS).
- **Kondensiert in eigenen Worten** aus dem Vor-Artikel-Segment, keine wortgetreuen Zitate, keine Blockquotes, keine Anführungszeichen um Original-Sätze. Inhaltliche Treue zum Vor-Artikel-Segment erforderlich.
- **Perspektivtreue** — Ich-/Wir-Stimme des Haupttexts. Keine dritte Person. Wenn fremde Stimme (z. B. Erzieher:in, Therapeut:in) im Vor-Artikel, in Rahmen-Satz aus Autor-Perspektive einbetten („Sie fragten uns: …").
- **Keine Fettungen.**
- **Kein Bild** aus Vor-Artikel-Segment.
- **Kein Hinweis im Lese-Text** auf das Vor-Artikel-Segment. Keine URL-Nennung.

H2 über der Tabelle: W-Frage in der Erzählperspektive des Haupttexts („Wie begann …?", „Wie kam es zu …?").

**Pflicht-Vor-/Nachspann (v4S2):** Direkt vor der Tabelle steht ein **Vorspann-Absatz** (1–2 Sätze, nicht fett, perspektivtreu, `origin="new"`, `kap_ref="Tabellen-Vorspann"`), der den Leser auf die Tabelle hinführt. Direkt nach der Tabelle und vor dem ersten `kept`-Absatz (sowie vor etwaigen neuen H3) steht ein **Nachspann-Absatz** (gleiche Form, `kap_ref="Tabellen-Nachspann"`), der zurück in den fortlaufenden Haupttext führt. Beispiel-Formulierungen und vollständige Reihenfolge siehe Hauptkapitel „Pflicht-Vorspann/Pflicht-Nachspann".

**Position:** Standard = nach dem Lede, in `sections[1]` als Block aus H2-W-Frage → Vorspann → Tabelle → Nachspann → erste Original-Inhalte des Haupttexts. Ausnahme: Wenn Vor-Artikel zeitlich NACH dem Haupttext liegt (selten), gleicher Block am Ende in `sections[N]`.

## Z-3. Wegfall-Entscheidungen dokumentieren

Im Meta-Block eine Unter-Liste „Nicht in die Rückblick-Tabelle übernommen" führen mit den ausgelassenen Inhalten aus dem Vor-Artikel-Segment:
- Rand-Hinweise auf andere Themen.
- Info-Kästen / H3-Exkurse mit Nebenthemen.
- Ankündigungen nächster Beiträge / reine Abschieds-Absätze.
- Doppelte Inhalte (bereits im Haupttext).

Prinzip: So wenig wie möglich weglassen.

## Z-4. Redirect-Empfehlung

Als `<div class="redirect-note">` im Meta-Block. Quelle = `<VOR_ARTIKEL_URL_REVIEWER_EINTRAGEN>` (Platzhalter, Reviewer trägt nach). Ziel = `url_spalte_J` aus Excel.

## Z-5. Pharmakovigilanz-Code (M-DE-…)

- Code des Haupttext-Segments (= jüngeres Segment) bleibt am Artikelende 1:1.
- Code des Vor-Artikel-Segments entfällt.
- Beide Codes im Meta-Block dokumentieren.
- Suche im Markdown nach dem Muster `M-DE-` gefolgt von Zeichen; jedes Vorkommen einem Segment zuordnen.

## Z-6. Längen-Regel

- Keine feste Obergrenze.
- Ziel: kompakter als Summe beider Originale.
- `budget_check.neue_elemente_woerter` zählt Rückblick-Tabelle + neue H2/H3 + Meta-Block + angepasster CTA und muss ≤ 30 % von `wortzahl_original` liegen.

## Z-7. Zählungen bei Zusammenlegung

- **Absätze:** nur Haupttext-Segment. Original = Optimiert. Rückblick-Tabelle, Tabellen-Vorspann und Tabellen-Nachspann (v4S2) zählen **nicht** als Original-Absätze.
- **Fettungen:** nur Haupttext-Segment. Rückblick-Tabelle, Vorspann und Nachspann enthalten keine Fettungen.
- **Wörter:** Gesamt inkl. Rückblick-Tabelle, Vorspann, Nachspann und Meta-Block.
- **Budget-Check:** `budget_check.neue_elemente_woerter` zählt zusätzlich zu Tabelle, neuen H2/H3, Meta-Block und CTA auch Vorspann + Nachspann. Muss ≤ 30 % von `wortzahl_original` bleiben (typischer Zusatz Vorspann+Nachspann: ~30 Wörter).

---

## Häufige Fehler (Zusammenlegung)

Die folgenden Fehlermuster dürfen nicht auftreten.

**Fehler 1: Vor-Artikel-Inhalt im Haupttext belassen.**
Das Vor-Artikel-Segment darf **ausschließlich** in der Rückblick-Tabelle erscheinen. Sätze, Absätze oder Überschriften aus dem Vor-Artikel-Segment dürfen nicht in `sections[1..]` als regulärer Haupttext auftauchen.

**Fehler 2: Wortgetreue Zitate in der Rückblick-Tabelle.**
Die Tabelle enthält **kondensierten, neu formulierten** Text. Keine `"…"`-Zitate. Keine Blockquotes. Keine 1:1 übernommenen Sätze aus dem Vor-Artikel-Segment.

**Fehler 3: Fettungen in der Rückblick-Tabelle.**
Keine `<strong>`, kein `**…**`, kein `<b>`. Tabelle komplett fett-frei.

**Fehler 4: Falsche Alters-Zuordnung.**
Wenn die Rückblick-Marker („inzwischen", „mittlerweile") im Vor-Artikel-Segment stehen, ist das Split unter Umständen falsch — diese Marker gehören ins jüngere Segment. Vor dem Schreiben Alters-Entscheidung aus Schritt 2a.4 nochmal gegen das gewählte Split prüfen.

**Fehler 5: Halluzinierter Vor-Artikel-Inhalt.**
Alle Fakten in der Rückblick-Tabelle müssen sich auf konkrete Textstellen im Vor-Artikel-Segment zurückführen lassen. Keine Ergänzungen aus der Live-URL, keine externen Recherchen, keine Rekonstruktion aus dem Titel.

**Fehler 6: Original-H2 ersetzt oder zur H3 degradiert (Haupttext-Segment).**
Siehe Regel 2 und Regel 5 Fall 2 — Original-H2 des Haupttext-Segments bleibt H2.

**Fehler 7: H2-Block mit 3+ Absätzen ohne H3-Unterteilung.**
Siehe Regel 5 und H3-Dichte-Regel.

**Fehler 8: Redirect-Block mit erfundener Vor-Artikel-URL.**
Die URL des Vor-Artikels ist in der Pipeline nicht verfügbar. Immer Platzhalter `<VOR_ARTIKEL_URL_REVIEWER_EINTRAGEN>`; Reviewer trägt nach.

**Fehler 9: Zweiter Lede im Hauptteil.**
Nur das Haupttext-Segment hat einen Lede. Der (ggf. vorhandene) Lede des Vor-Artikel-Segments fließt kondensiert in die Rückblick-Tabelle, nicht als Lede in den Output.

---

## Beispiel-Aufrufe

```bash
python run_pipeline.py --uids 1155 --prompt ACTA_UGC_Master-Prompt_Zusammenlegung_Eltern-Blogger_v4S2
python run_pipeline.py --uids 1155,1262 --prompt ACTA_UGC_Master-Prompt_Zusammenlegung_Eltern-Blogger_v4S2
```

Claude liest dann ausschließlich den User-Prompt (aufgebaut aus `output/extracted/page_<uid>.json`):

1. `=== KONTEXT ===` — uid, titel, slug, abstract, author, breadcrumb, wortzahl_original.
2. `=== EXCEL-ZEILE ===` — insbesondere `kommentar` (Modus-Trigger) und `seitentitel_spalte_I` (Ziel-Titel).
3. `=== BILDER ===` — optional.
4. `=== ORIGINAL-ARTIKEL ===` — enthält im Zusammenlegungs-Modus **beide Artikel-Texte** hintereinander in unbekannter Reihenfolge.

Ablauf:
1. Schritt 0: Modus aus `kommentar`, Perspektive aus Text.
2. Bei Zusammenlegung: Schritt 2a (Split-Inventar, Alters-Bestimmung, Rollen-Zuweisung).
3. Schritt 2b auf dem Haupttext-Segment.
4. Schritte 3–4 (H1-Check, H2/H3-Struktur).
5. Schritt 4b (11-Punkt-Selbstkontrolle).
6. Schritt 5 (JSON-Output mit Meta-Block, Rückblick-Tabelle, Haupttext-Segment 1:1, CTA, optional Bearbeitungs-Bilanz).
Element	Original	Optimiert	Differenz
H1	2 (je 1 pro Segment)	1	−1 (Zusammenlegung)
H2	...	...	...
H3	...	...	...
Absätze Haupttext	N	N	±0
Fettungen Haupttext	N	N	±0
Wörter gesamt	X	Y	+/−Z%
Bilder	N	N	±0
CTA	1 generisch	1 perspektivenspezifisch	angepasst