appRobotHoming/doc/Homing_5_Pose.md

# Homing 5 – Pose-Schätzung per Bundle-Adjustment (`hybrid`)

> Technische Detail-Doku zu [`Homing.md`](Homing.md) — **Verfeinerungsschritt NACH
> der 4b-Kette** ([`Homing_1_StepByStep.md`](Homing_1_StepByStep.md)), **nicht**
> deren Ersatz: `5_pose_estimation.py` braucht den `accumulated_state` von 4b als
> Startwert. Ohne guten Startwert läuft die interne Optimierung mangels eigener
> verlässlicher Initialisierung leicht in ein lokales Minimum (siehe „Wichtige
> Einschränkung" unten).
> Status: Skript liegt bereits in `scripts/5_pose_estimation.py`, **noch nicht**
> in `homingOrchestrator.js`/`server.js` verdrahtet — und braucht noch einen
> kleinen Code-Hook, um den 4b-Startwert überhaupt entgegennehmen zu können
> (siehe Offene Punkte).

---

## Herkunft

`scripts/5_pose_estimation.py` ist 1:1 (byte-identisch, per Diff verifiziert)
aus dem Schwesterprojekt **`appRobotRendering`** übernommen
(`pipeline/pose_estimation.py`, dort Stufe 4 der allgemeinen Pose-Pipeline).
Mitgewandert und ebenfalls identisch: `scripts/robot_fk.py`. Dort ist das
Verfahren an zehn simulierten Szenen mit bekannter Grundwahrheit validiert
(`doc/pipeline.tex` im Rendering-Projekt) — diese Zahlen unten sind **Simulationsergebnisse
aus appRobotRendering**, keine Messung an appRobotHoming/echter Hardware.

`scripts/robot_1781069752019.json` enthält bereits den passenden
`pose_estimation`-Konfigurationsblock (identisch zu den Rendering-Defaults:
`method: hybrid`, `normal_weight: 100`, `huber_delta_mm: 8.0`, …) — die Datenseite
ist also schon vorbereitet, nur die Prozess-Verdrahtung fehlt noch.

---

## Einordnung in den Homing-Ablauf

```
1_detect_aruco_observations.py  ┐
2_estimate_camera_from_observations.py  │  = "Board-Pipeline" (Homing_0_Camera.md)
3b_corner_marker_poses.py       ┘
        │
        ▼  aruco_marker_poses.json
        │
        ▼
4b_revolute_angle.py × N  (sequenziell root→tip, über --from-state verkettet)
        │  Homing_1_StepByStep.md — liefert pro Gelenk eine Schätzung
        │  (Primär/Fallback-1/Fallback-2), abhängig von Sichtbarkeit
        ▼
accumulated_state {x,y,z,a,b,c,e}   ← Startwert, NICHT optional überspringbar
        │
        ▼
5_pose_estimation.py  (method=global_ba, accumulated_state als Startwert x0)
        │  dieses Dokument — EIN gemeinsamer Bündelausgleich über alle 7
        │  Variablen gleichzeitig, verfeinert/korrigiert den 4b-Zustand global
        ▼
robot_state.json { movements: {…}, residual_rms, … }
```

**Wichtig:** `5_pose_estimation.py` ist **kein** Ersatz für die 4b-Kette, sondern
ein **Verfeinerungsschritt danach**, der deren `accumulated_state` als Startwert
braucht. Lässt man die 4b-Kette weg, fehlt dieser Startwert — die interne
Optimierung initialisiert dann faktisch bei `0` für jede Variable, und bei einer
beim Einschalten unbekannten Roboterpose ist das ein guter Weg in ein lokales
Minimum (Mechanismus s. „Wichtige Einschränkung" unten).

| Stufe | Eingabe | Aufruf | Ausgabe |
|---|---|---|---|
| **4b-Kette** (liefert den Startwert) | `aruco_marker_poses.json` + extern geschätztes `x_mm` | N Prozesse, je Link einer, `--from-state` verkettet | `accumulated_state` (flach: `x,y,z,a,b,c,e`) |
| **`5_pose_estimation.py`** (verfeinert global) | `aruco_marker_poses.json` **+ `accumulated_state` aus 4b als Startwert** | 1 Prozess | `robot_state.json` → `movements.<var>.{value,unit,observable,confidence,n_markers}` |

---

## Wie es funktioniert (kurz)

Das Skript parametrisiert über **Gelenkvariablen** (nicht Links) und liest pro
Marker Position **und gemessene Normale** aus `aruco_marker_poses.json`
(3b-Ausgabe). Vier austauschbare Verfahren (`robot.json` → `pose_estimation.method`),
`hybrid` ist Standard und kombiniert die letzten beiden:

1. `sequential_vector` — analytische Winkel aus Marker-Paar-Vektoren (schnell, braucht ≥2 Marker/Gelenk)
2. `sequential_fk` — blockweiser nichtlinearer Fit entlang der Kette, vorherige Variablen eingefroren, Multi-Start `{0,60,…,300}°` gegen lokale Minima
3. `global_ba` — **einziges** Bündelausgleichsproblem über **alle 7 Variablen gleichzeitig** (`scipy.optimize.least_squares`, Huber-Loss)
4. **`hybrid`** = 2 als Startwert → 3 als Verfeinerung

Die Blockbildung in `analyze_chain()` ist generisch aus der FK-Topologie
abgeleitet (keine festen Link-Namen) — passt damit zur Projekt-Konvention
„Scripts müssen Szenen/Ketten automatisch erkennen, nichts hartkodieren".
Für *dieses* Robot-Modell ergibt sich u. a. der Block `{x, y}`: `Base` (Variable
`x`) hat **keine eigenen Marker** (`"markers": []` in `robot_1781069752019.json`)
und wird automatisch mit `Arm1` (Variable `y`, 5 Marker) zu einem gemeinsamen
Least-Squares-Fit zusammengefasst.

Jedes Ergebnis kommt mit einer Konfidenz pro Variable (`high/medium/low/none`,
abgeleitet aus sichtbaren Markern je Block) — analog zur 4b-Kette, aber pro
Block statt pro Einzel-Fallback-Stufe.

### Wichtige Einschränkung: Startwert und lokale Minima

`estimate_pose()` ruft für `global_ba`/`hybrid` **immer zuerst selbst**
`estimate_sequential_fk()` als „billigen, robusten Init" auf
(`scripts/5_pose_estimation.py:471-476`) — es gibt aktuell **keinen** Parameter,
um stattdessen einen extern vorgegebenen Startwert (z. B. den `accumulated_state`
aus 4b) einzuspeisen, obwohl `estimate_global_ba()` selbst intern bereits ein
`x0`-Dict entgegennimmt (`:236-237`).

`estimate_sequential_fk()` initialisiert jede Variable bei `0.0` und rastert den
Multi-Start `{0,60,120,180,240,300}°` **nur über die erste Variable eines
Blocks** (`bvars[0]`) — und auch das **nur, wenn diese selbst `revolute`
ist** (`:296-304`). Für dieses Robotermodell heißt das konkret:

- Block `{x, y}` (Base markerlos → mit Arm1 zusammengefasst): `bvars[0]` ist
  `x` (linear) → `lead_type != "revolute"` → **kein** Multi-Start. `y`
  (Schultergelenk, Arm1) wird in einem einzigen Lauf ab `0°` gefittet.
- Block `{b, c, e}` (Hand/Palm markerlos → mit den Fingermarkern zusammengefasst):
  nur `b` bekommt den 6-Punkte-Raster; `c` und `e` starten in **jedem** der
  6 Läufe fix bei `0`.
- Einzelvariablen-Blöcke wie Ellbow (`{z}`) oder Arm2 (`{a}`) bekommen den
  vollen Raster auf sich selbst — dort ist das Risiko deutlich kleiner.

Liegt die echte Pose in `y`, `c` oder `e` weit von `0` entfernt (beim Homing
nach dem Einschalten der Normalfall, nicht die Ausnahme), kann schon die
`sequential_fk`-Vorstufe in einem falschen lokalen Minimum landen — die
anschließende `global_ba`-Verfeinerung poliert dieses falsche Minimum dann nur
noch, statt es zu verlassen. Das deckt sich mit dem in der Validierungstabelle
unten sichtbaren großen Abstand zwischen Mittelwert (0,253°) und Schlechtestfall
(1,568°) bei sonst niedriger Streuung (0,134°) — ein Muster, das zu „meist
gut, gelegentlich falsches Minimum" passt.

**Konsequenz:** `5_pose_estimation.py` sollte in appRobotHoming **nicht kalt**
laufen, sondern mit dem `accumulated_state` der 4b-Kette als Startwert (Details
und der dafür nötige Code-Hook: Abschnitt „Integrationsschritte").

### Validierung im Rendering-Projekt (Simulation, 10 Posen, bekannte GT)

| Verfahren | Winkel Ø [°] | Winkel schlechtest. [°] | Position Ø [mm] | Position schlechtest. [mm] |
|---|---|---|---|---|
| `sequential_vector` | 0,315 | 1,717 | 0,144 | 0,712 |
| `sequential_fk` | 0,434 | 1,838 | 0,158 | 0,851 |
| `global_ba` | 0,253 | 1,568 | 0,103 | 0,390 |
| **`hybrid`** | **0,253** | **1,568** | **0,103** | **0,390** |

(Quelle: `appRobotRendering/doc/pipeline.tex`, Abschnitt „Validierung und Ergebnisse".)

---

## Vorteile

- **Bestes/stabilstes Verfahren im Rendering-Benchmark** (s. Tabelle oben) — unter
  allen vier Methoden der niedrigste Mittel- *und* Worst-Case-Fehler.
- **Überbrückt markerlose Gelenke automatisch.** `Hand` (Variable `b`) und `Palm`
  (`c`) tragen keine eigenen Marker — `global_ba` zieht die Information aus den
  Fingermarkern *rückwärts* durch die Kette. Die 4b-Kette braucht dafür explizit
  einen Fallback pro Gelenk; hier passiert es als Nebenprodukt der gemeinsamen
  Optimierung.
- **Fittet `x` und `y` gemeinsam aus denselben Arm1-Markern** (Block `{x,y}`,
  weil `Base` markerlos ist) — konsistenter als zwei getrennte Schätzungen.
  Ersetzt `estimateXFromMarkers()` aber **nicht**: dieser Block ist genau einer
  der beiden, die ohne guten Startwert anfällig für ein lokales Minimum sind
  (s. „Wichtige Einschränkung" unten) — die gemeinsame Schätzung ist also ein
  Mehrwert *nach* einer 4b-Vorschätzung, kein Grund, diese zu überspringen.
- **Funktioniert mit nur 1 sichtbarem Marker pro Gelenk**, weil das Residuum
  Position **und** Normale nutzt (Gl. in `residual_vector()`) — die 4b-Primärmethode
  braucht dafür mindestens 2.
- **Ist die automatisierte Form der bereits manuell durchgeführten Gegenrechnung.**
  Der Befund vom 2026-06-16 in `Homing_1_StepByStep.md` (Ellbow: Fallback-2 lag
  35–40° neben einer von Hand gerechneten Least-Squares-Kontrolle über Ellbow- *und*
  Arm2-Marker) ist exakt das, was `global_ba`/`hybrid` automatisch und für **alle**
  Gelenke gleichzeitig macht. Ein Lauf hätte den Fallback-2-Fehler vermutlich direkt
  erkennbar gemacht.
- **Robuste Verlustfunktion (Huber)** dämpft einzelne Ausreißer-Marker (Fehldetektion,
  Verdeckung) automatisch, statt dass ein einzelner schlechter Marker das ganze
  Gelenk verfälscht.
- **Multi-Start über mehrere Startwinkel** hilft dort, wo er greift (Blöcke mit
  genau einer Variable, z. B. Ellbow/`z`, Arm2/`a`) — für Homing wertvoller als
  für Kalibrierung, weil beim Einschalten die Pose komplett unbekannt ist. Greift
  aber **nicht** bei den gekoppelten Blöcken `{x,y}` und `{b,c,e}` (s. u.) — genau
  dort ist ein externer Startwert aus 4b nötig.

## Nachteile

- **Kein verlässlicher eigener Kaltstart — Startwert von außen zwingend nötig.**
  Wie im Abschnitt „Wichtige Einschränkung" hergeleitet: der interne Multi-Start
  deckt nur Einzelvariablen-Blöcke ab, nicht die gekoppelten Blöcke `{x,y}` und
  `{b,c,e}`. Allein aufgerufen (ohne `accumulated_state` aus 4b) ist
  `5_pose_estimation.py` daher beim Homing real gefährdet, in einem lokalen
  Minimum zu landen, statt die echte Pose zu finden — kein Rand-, sondern ein
  Kernfall, weil die Pose beim Einschalten grundsätzlich unbekannt ist.
- **`scipy` fehlt aktuell im appRobotHoming-Container.** `docker-compose.yaml`
  installiert nur `opencv-python-headless numpy`
  (`pip3 install --quiet --no-cache-dir opencv-python-headless numpy`). Ohne
  `scipy` greift `HAVE_SCIPY=False`: `estimate_sequential_fk` lässt jeden Block
  auf `0.0` stehen, `estimate_global_ba` gibt den (dann ebenfalls nullwertigen)
  Startwert unverändert zurück — **kein Fehler, nur eine `[WARN]`-Zeile auf
  stdout.** Das ist ein stiller Fehlmodus: muss vor dem ersten Einsatz behoben
  werden (scipy zur `pip3 install`-Zeile ergänzen).
- **Zwei nichtlineare Least-Squares-Läufe statt eines geschlossenen Ausdrucks** —
  langsamer als `sequential_vector` und langsamer als ein einzelner
  `4b_revolute_angle.py`-Aufruf. Für „schnell, vollautomatisch" (Anspruch aus
  `Homing.md`) noch nicht auf echter Hardware gemessen.
- **Kein progressives Zwischenergebnis.** Die 4b-Kette liefert nach jedem Link
  ein SSE-`analysis`-Event und aktualisiert den Board-Viewer live
  („progressiver Update je erkanntem Gelenk", `Homing.md` → Implementierung).
  `estimate_pose()` gibt nur den fertigen Endzustand zurück — für dieselbe UX
  müsste man zusätzlich die internen Zwischenstände von `estimate_sequential_fk()`
  exponieren.
- **Verliert die dokumentierte Fallback-Diagnostik.** `Homing_1_StepByStep.md`
  protokolliert pro Gelenk, *welche* Stufe gegriffen hat (`method`: primary /
  fallback_1 / fallback_2). `5_pose_estimation.py` liefert nur eine
  Block-Konfidenz (`high/medium/low/none`), nicht *welche* Heuristik intern
  gewirkt hat — weniger Transparenz beim Debuggen einzelner Gelenke.
- **Ausgabeformat passt nicht direkt auf `/api/state`.** Der Endpunkt erwartet
  ein flaches `{x,y,z,a,b,c,e}` (`accumulated_state`, siehe
  `server/server.js` → `POST /api/homing/send-state`), `5_pose_estimation.py`
  schreibt verschachtelt (`movements.<var>.value`). Eine kleine Adapterfunktion
  ist nötig, kein Drop-in-Ersatz.
- **Unbeobachtbare Gelenke werden als `0.0` ausgegeben**, nicht als `null`
  (Konfidenz `none`/`observable:false` steht nur als Metadatum daneben). Das
  widerspricht der sonst im Projektverbund befolgten Konvention „Unbekannt bleibt
  `null`, nie erfundene `0`". Eine Integration muss `observable:false` aktiv auf
  `null` ummappen, bevor der Zustand weitergereicht wird — sonst wandert eine
  stille `0°`/`0mm` in Richtung Robotersteuerung.
- **Noch nicht an echten Kamerabildern/Markern validiert.** Die Zahlen oben sind
  Simulation aus appRobotRendering (saubere FK-Marker-Positionen, definierter
  Renderfehler-Rauschboden). Reale Marker-Ungenauigkeiten (s.
  `Kalibrierung_Marker.md`) und reale Kameranoise könnten andere `huber_delta_mm`/
  `normal_weight`-Werte als die übernommenen Defaults verlangen.

## Besonderheiten

- **Reiner, unveränderter Import-Stand** — momentan git-`??` (untracked), noch
  nicht in `homingOrchestrator.js`/`server.js` referenziert (nur `4b_revolute_angle.py`
  ist dort als `SCRIPT_4B` verdrahtet).
- **Schema-Kompatibilität zur lokalen `3b_corner_marker_poses.py` bereits
  geprüft:** Feldnamen `marker_id`, `position_mm`/`position_m`, `normal`,
  `num_cameras` stimmen 1:1 — `load_observations()` braucht keine Anpassung.
- **Namens-Kollision mit `5_camera_z_refine.py`** — zwei Skripte teilen sich das
  Präfix `5_`. Entspricht der Konvention aus appRobotRendering, wo mehrere
  Dateien sich ein Stufen-Präfix teilen (z. B. `3_*`, `4_*`); kein Bug, aber beim
  Lesen der `scripts/`-Liste leicht zu verwechseln.
- **Die `pose_estimation.method`-Option erlaubt gezieltes A/B-Testen** ohne
  Codeänderung: `--method sequential_vector|sequential_fk|global_ba|hybrid` per
  CLI-Override, oder dauerhaft über `robot_1781069752019.json` →
  `pose_estimation.method`. Nützlich, um z. B. `hybrid` parallel zur bestehenden
  4b-Kette laufen zu lassen und beide Ergebnisse zu vergleichen, bevor irgendetwas
  ersetzt wird.
- **`finger_block_joints`/`per_link_method`** stehen schon (leer) in der
  robot.json — vorbereitete, aber im Skript bisher ungenutzte Erweiterungspunkte
  aus appRobotRendering.

---

## Aufruf (Stand-alone, zum Testen)

⚠️ Diese Aufrufe laufen **kalt** (kein externer Startwert — der Code-Hook dafür
existiert noch nicht, s. Integrationsschritte). Geeignet, um das Kaltstart-/
Lokales-Minimum-Verhalten aus „Wichtige Einschränkung" zu beobachten und zu
reproduzieren — **nicht** der vorgesehene Produktionspfad.

```bash
python scripts/5_pose_estimation.py data/homing/<run>/aruco_marker_poses.json \
       -robot scripts/robot_1781069752019.json \
       -out   data/homing/<run>/robot_state.json
# Verfahren erzwingen, z.B. zum gezielten Vergleich einzelner Methoden:
python scripts/5_pose_estimation.py data/homing/<run>/aruco_marker_poses.json \
       -robot scripts/robot_1781069752019.json --method global_ba
```

---

## Integrationsschritte (Offene Punkte)

- [ ] **`scipy` in `docker-compose.yaml` ergänzen** (`pip3 install …` Zeile) —
  ohne das läuft `hybrid` lautlos auf Nullzustand.
- [x] **Architektur entschieden:** 4b-Kette läuft zuerst und liefert den
  `accumulated_state` als Startwert; `5_pose_estimation.py` läuft danach als
  globaler Verfeinerungsschritt darüber. Kein Ersatz, keine parallele
  Alternative — siehe „Wichtige Einschränkung" oben.
- [ ] **Code-Hook in `5_pose_estimation.py` ergänzen:** aktuell gibt es keinen
  Weg, einen externen Startwert hineinzugeben. Vorschlag: CLI-Flag analog zu 4b
  (`--from-state accumulated_state.json`), das den 4b-Zustand als `x0` direkt an
  `estimate_global_ba()` durchreicht (Parameter existiert dort bereits,
  `:236-237`) und so den internen `estimate_sequential_fk()`-Kaltstart in
  `estimate_pose()` (`:471-476`) umgeht bzw. nur als Fallback nutzt, falls kein
  externer Startwert übergeben wird.
- [ ] Adapter `movements.<var>.value` → flaches `{x,…,e}`-State-Objekt für
  `POST /api/homing/send-state`; dabei `observable:false → null` ummappen.
- [ ] Anbindung in `homingOrchestrator.js` (neuer Schritt, analog `runBoardPipeline`/
  4b-Loop) + SSE-Event(s) für Fortschritt (auch ohne echtes Zwischenergebnis,
  z. B. ein `step`-Event „läuft" / „fertig").
- [ ] Erste echte Messung: `hybrid`-Ergebnis gegen 4b-Kette auf demselben
  `data/homing/<run>/aruco_marker_poses.json` vergleichen (insbesondere am
  Ellbow-Fall aus `Homing_1_StepByStep.md`).
- [ ] `huber_delta_mm`/`normal_weight` ggf. gegen reale Marker-Genauigkeit
  nachjustieren (Defaults sind aus appRobotRendering-Simulation übernommen).
- [ ] Eintrag in `Homing.md`-Tabelle (Doku-Übersicht) ergänzen, sobald
  verdrahtet.

---

## Verweise

- Allgemeiner Ablauf: [`Homing.md`](Homing.md)
- Vorheriger Schritt (Kamera/Triangulation, liefert den gemeinsamen Input):
  [`Homing_0_Camera.md`](Homing_0_Camera.md)
- Alternative/Ist-Zustand (4b-Kette, dieselbe Aufgabe anders gelöst):
  [`Homing_1_StepByStep.md`](Homing_1_StepByStep.md)
- Ursprung & Validierung: Projekt **`appRobotRendering`**,
  `pipeline/pose_estimation.py` + `doc/pipeline.tex` (Abschnitte „Pose-Estimation:
  Vier Schätzverfahren" und „Validierung und Ergebnisse").