# Homing 5 – Pose-Schätzung per Bundle-Adjustment (`hybrid`) > Technische Detail-Doku zu [`Homing.md`](Homing.md) — **Verfeinerungsschritt NACH > der 4b-Kette** ([`Homing_1_StepByStep.md`](Homing_1_StepByStep.md)), **nicht** > deren Ersatz: `5_pose_estimation.py` braucht den `accumulated_state` von 4b als > Startwert. Ohne guten Startwert läuft die interne Optimierung mangels eigener > verlässlicher Initialisierung leicht in ein lokales Minimum (siehe „Wichtige > Einschränkung" unten). > Status: Skript liegt bereits in `scripts/5_pose_estimation.py`, **noch nicht** > in `homingOrchestrator.js`/`server.js` verdrahtet — und braucht noch einen > kleinen Code-Hook, um den 4b-Startwert überhaupt entgegennehmen zu können > (siehe Offene Punkte). --- ## Herkunft `scripts/5_pose_estimation.py` ist 1:1 (byte-identisch, per Diff verifiziert) aus dem Schwesterprojekt **`appRobotRendering`** übernommen (`pipeline/pose_estimation.py`, dort Stufe 4 der allgemeinen Pose-Pipeline). Mitgewandert und ebenfalls identisch: `scripts/robot_fk.py`. Dort ist das Verfahren an zehn simulierten Szenen mit bekannter Grundwahrheit validiert (`doc/pipeline.tex` im Rendering-Projekt) — diese Zahlen unten sind **Simulationsergebnisse aus appRobotRendering**, keine Messung an appRobotHoming/echter Hardware. `scripts/robot_1781069752019.json` enthält bereits den passenden `pose_estimation`-Konfigurationsblock (identisch zu den Rendering-Defaults: `method: hybrid`, `normal_weight: 100`, `huber_delta_mm: 8.0`, …) — die Datenseite ist also schon vorbereitet, nur die Prozess-Verdrahtung fehlt noch. --- ## Einordnung in den Homing-Ablauf ``` 1_detect_aruco_observations.py ┐ 2_estimate_camera_from_observations.py │ = "Board-Pipeline" (Homing_0_Camera.md) 3b_corner_marker_poses.py ┘ │ ▼ aruco_marker_poses.json │ ▼ 4b_revolute_angle.py × N (sequenziell root→tip, über --from-state verkettet) │ Homing_1_StepByStep.md — liefert pro Gelenk eine Schätzung │ (Primär/Fallback-1/Fallback-2), abhängig von Sichtbarkeit ▼ accumulated_state {x,y,z,a,b,c,e} ← Startwert, NICHT optional überspringbar │ ▼ 5_pose_estimation.py (method=global_ba, accumulated_state als Startwert x0) │ dieses Dokument — EIN gemeinsamer Bündelausgleich über alle 7 │ Variablen gleichzeitig, verfeinert/korrigiert den 4b-Zustand global ▼ robot_state.json { movements: {…}, residual_rms, … } ``` **Wichtig:** `5_pose_estimation.py` ist **kein** Ersatz für die 4b-Kette, sondern ein **Verfeinerungsschritt danach**, der deren `accumulated_state` als Startwert braucht. Lässt man die 4b-Kette weg, fehlt dieser Startwert — die interne Optimierung initialisiert dann faktisch bei `0` für jede Variable, und bei einer beim Einschalten unbekannten Roboterpose ist das ein guter Weg in ein lokales Minimum (Mechanismus s. „Wichtige Einschränkung" unten). | Stufe | Eingabe | Aufruf | Ausgabe | |---|---|---|---| | **4b-Kette** (liefert den Startwert) | `aruco_marker_poses.json` + extern geschätztes `x_mm` | N Prozesse, je Link einer, `--from-state` verkettet | `accumulated_state` (flach: `x,y,z,a,b,c,e`) | | **`5_pose_estimation.py`** (verfeinert global) | `aruco_marker_poses.json` **+ `accumulated_state` aus 4b als Startwert** | 1 Prozess | `robot_state.json` → `movements..{value,unit,observable,confidence,n_markers}` | --- ## Wie es funktioniert (kurz) Das Skript parametrisiert über **Gelenkvariablen** (nicht Links) und liest pro Marker Position **und gemessene Normale** aus `aruco_marker_poses.json` (3b-Ausgabe). Vier austauschbare Verfahren (`robot.json` → `pose_estimation.method`), `hybrid` ist Standard und kombiniert die letzten beiden: 1. `sequential_vector` — analytische Winkel aus Marker-Paar-Vektoren (schnell, braucht ≥2 Marker/Gelenk) 2. `sequential_fk` — blockweiser nichtlinearer Fit entlang der Kette, vorherige Variablen eingefroren, Multi-Start `{0,60,…,300}°` gegen lokale Minima 3. `global_ba` — **einziges** Bündelausgleichsproblem über **alle 7 Variablen gleichzeitig** (`scipy.optimize.least_squares`, Huber-Loss) 4. **`hybrid`** = 2 als Startwert → 3 als Verfeinerung Die Blockbildung in `analyze_chain()` ist generisch aus der FK-Topologie abgeleitet (keine festen Link-Namen) — passt damit zur Projekt-Konvention „Scripts müssen Szenen/Ketten automatisch erkennen, nichts hartkodieren". Für *dieses* Robot-Modell ergibt sich u. a. der Block `{x, y}`: `Base` (Variable `x`) hat **keine eigenen Marker** (`"markers": []` in `robot_1781069752019.json`) und wird automatisch mit `Arm1` (Variable `y`, 5 Marker) zu einem gemeinsamen Least-Squares-Fit zusammengefasst. Jedes Ergebnis kommt mit einer Konfidenz pro Variable (`high/medium/low/none`, abgeleitet aus sichtbaren Markern je Block) — analog zur 4b-Kette, aber pro Block statt pro Einzel-Fallback-Stufe. ### Wichtige Einschränkung: Startwert und lokale Minima `estimate_pose()` ruft für `global_ba`/`hybrid` **immer zuerst selbst** `estimate_sequential_fk()` als „billigen, robusten Init" auf (`scripts/5_pose_estimation.py:471-476`) — es gibt aktuell **keinen** Parameter, um stattdessen einen extern vorgegebenen Startwert (z. B. den `accumulated_state` aus 4b) einzuspeisen, obwohl `estimate_global_ba()` selbst intern bereits ein `x0`-Dict entgegennimmt (`:236-237`). `estimate_sequential_fk()` initialisiert jede Variable bei `0.0` und rastert den Multi-Start `{0,60,120,180,240,300}°` **nur über die erste Variable eines Blocks** (`bvars[0]`) — und auch das **nur, wenn diese selbst `revolute` ist** (`:296-304`). Für dieses Robotermodell heißt das konkret: - Block `{x, y}` (Base markerlos → mit Arm1 zusammengefasst): `bvars[0]` ist `x` (linear) → `lead_type != "revolute"` → **kein** Multi-Start. `y` (Schultergelenk, Arm1) wird in einem einzigen Lauf ab `0°` gefittet. - Block `{b, c, e}` (Hand/Palm markerlos → mit den Fingermarkern zusammengefasst): nur `b` bekommt den 6-Punkte-Raster; `c` und `e` starten in **jedem** der 6 Läufe fix bei `0`. - Einzelvariablen-Blöcke wie Ellbow (`{z}`) oder Arm2 (`{a}`) bekommen den vollen Raster auf sich selbst — dort ist das Risiko deutlich kleiner. Liegt die echte Pose in `y`, `c` oder `e` weit von `0` entfernt (beim Homing nach dem Einschalten der Normalfall, nicht die Ausnahme), kann schon die `sequential_fk`-Vorstufe in einem falschen lokalen Minimum landen — die anschließende `global_ba`-Verfeinerung poliert dieses falsche Minimum dann nur noch, statt es zu verlassen. Das deckt sich mit dem in der Validierungstabelle unten sichtbaren großen Abstand zwischen Mittelwert (0,253°) und Schlechtestfall (1,568°) bei sonst niedriger Streuung (0,134°) — ein Muster, das zu „meist gut, gelegentlich falsches Minimum" passt. **Konsequenz:** `5_pose_estimation.py` sollte in appRobotHoming **nicht kalt** laufen, sondern mit dem `accumulated_state` der 4b-Kette als Startwert (Details und der dafür nötige Code-Hook: Abschnitt „Integrationsschritte"). ### Validierung im Rendering-Projekt (Simulation, 10 Posen, bekannte GT) | Verfahren | Winkel Ø [°] | Winkel schlechtest. [°] | Position Ø [mm] | Position schlechtest. [mm] | |---|---|---|---|---| | `sequential_vector` | 0,315 | 1,717 | 0,144 | 0,712 | | `sequential_fk` | 0,434 | 1,838 | 0,158 | 0,851 | | `global_ba` | 0,253 | 1,568 | 0,103 | 0,390 | | **`hybrid`** | **0,253** | **1,568** | **0,103** | **0,390** | (Quelle: `appRobotRendering/doc/pipeline.tex`, Abschnitt „Validierung und Ergebnisse".) --- ## Vorteile - **Bestes/stabilstes Verfahren im Rendering-Benchmark** (s. Tabelle oben) — unter allen vier Methoden der niedrigste Mittel- *und* Worst-Case-Fehler. - **Überbrückt markerlose Gelenke automatisch.** `Hand` (Variable `b`) und `Palm` (`c`) tragen keine eigenen Marker — `global_ba` zieht die Information aus den Fingermarkern *rückwärts* durch die Kette. Die 4b-Kette braucht dafür explizit einen Fallback pro Gelenk; hier passiert es als Nebenprodukt der gemeinsamen Optimierung. - **Fittet `x` und `y` gemeinsam aus denselben Arm1-Markern** (Block `{x,y}`, weil `Base` markerlos ist) — konsistenter als zwei getrennte Schätzungen. Ersetzt `estimateXFromMarkers()` aber **nicht**: dieser Block ist genau einer der beiden, die ohne guten Startwert anfällig für ein lokales Minimum sind (s. „Wichtige Einschränkung" unten) — die gemeinsame Schätzung ist also ein Mehrwert *nach* einer 4b-Vorschätzung, kein Grund, diese zu überspringen. - **Funktioniert mit nur 1 sichtbarem Marker pro Gelenk**, weil das Residuum Position **und** Normale nutzt (Gl. in `residual_vector()`) — die 4b-Primärmethode braucht dafür mindestens 2. - **Ist die automatisierte Form der bereits manuell durchgeführten Gegenrechnung.** Der Befund vom 2026-06-16 in `Homing_1_StepByStep.md` (Ellbow: Fallback-2 lag 35–40° neben einer von Hand gerechneten Least-Squares-Kontrolle über Ellbow- *und* Arm2-Marker) ist exakt das, was `global_ba`/`hybrid` automatisch und für **alle** Gelenke gleichzeitig macht. Ein Lauf hätte den Fallback-2-Fehler vermutlich direkt erkennbar gemacht. - **Robuste Verlustfunktion (Huber)** dämpft einzelne Ausreißer-Marker (Fehldetektion, Verdeckung) automatisch, statt dass ein einzelner schlechter Marker das ganze Gelenk verfälscht. - **Multi-Start über mehrere Startwinkel** hilft dort, wo er greift (Blöcke mit genau einer Variable, z. B. Ellbow/`z`, Arm2/`a`) — für Homing wertvoller als für Kalibrierung, weil beim Einschalten die Pose komplett unbekannt ist. Greift aber **nicht** bei den gekoppelten Blöcken `{x,y}` und `{b,c,e}` (s. u.) — genau dort ist ein externer Startwert aus 4b nötig. ## Nachteile - **Kein verlässlicher eigener Kaltstart — Startwert von außen zwingend nötig.** Wie im Abschnitt „Wichtige Einschränkung" hergeleitet: der interne Multi-Start deckt nur Einzelvariablen-Blöcke ab, nicht die gekoppelten Blöcke `{x,y}` und `{b,c,e}`. Allein aufgerufen (ohne `accumulated_state` aus 4b) ist `5_pose_estimation.py` daher beim Homing real gefährdet, in einem lokalen Minimum zu landen, statt die echte Pose zu finden — kein Rand-, sondern ein Kernfall, weil die Pose beim Einschalten grundsätzlich unbekannt ist. - **`scipy` fehlt aktuell im appRobotHoming-Container.** `docker-compose.yaml` installiert nur `opencv-python-headless numpy` (`pip3 install --quiet --no-cache-dir opencv-python-headless numpy`). Ohne `scipy` greift `HAVE_SCIPY=False`: `estimate_sequential_fk` lässt jeden Block auf `0.0` stehen, `estimate_global_ba` gibt den (dann ebenfalls nullwertigen) Startwert unverändert zurück — **kein Fehler, nur eine `[WARN]`-Zeile auf stdout.** Das ist ein stiller Fehlmodus: muss vor dem ersten Einsatz behoben werden (scipy zur `pip3 install`-Zeile ergänzen). - **Zwei nichtlineare Least-Squares-Läufe statt eines geschlossenen Ausdrucks** — langsamer als `sequential_vector` und langsamer als ein einzelner `4b_revolute_angle.py`-Aufruf. Für „schnell, vollautomatisch" (Anspruch aus `Homing.md`) noch nicht auf echter Hardware gemessen. - **Kein progressives Zwischenergebnis.** Die 4b-Kette liefert nach jedem Link ein SSE-`analysis`-Event und aktualisiert den Board-Viewer live („progressiver Update je erkanntem Gelenk", `Homing.md` → Implementierung). `estimate_pose()` gibt nur den fertigen Endzustand zurück — für dieselbe UX müsste man zusätzlich die internen Zwischenstände von `estimate_sequential_fk()` exponieren. - **Verliert die dokumentierte Fallback-Diagnostik.** `Homing_1_StepByStep.md` protokolliert pro Gelenk, *welche* Stufe gegriffen hat (`method`: primary / fallback_1 / fallback_2). `5_pose_estimation.py` liefert nur eine Block-Konfidenz (`high/medium/low/none`), nicht *welche* Heuristik intern gewirkt hat — weniger Transparenz beim Debuggen einzelner Gelenke. - **Ausgabeformat passt nicht direkt auf `/api/state`.** Der Endpunkt erwartet ein flaches `{x,y,z,a,b,c,e}` (`accumulated_state`, siehe `server/server.js` → `POST /api/homing/send-state`), `5_pose_estimation.py` schreibt verschachtelt (`movements..value`). Eine kleine Adapterfunktion ist nötig, kein Drop-in-Ersatz. - **Unbeobachtbare Gelenke werden als `0.0` ausgegeben**, nicht als `null` (Konfidenz `none`/`observable:false` steht nur als Metadatum daneben). Das widerspricht der sonst im Projektverbund befolgten Konvention „Unbekannt bleibt `null`, nie erfundene `0`". Eine Integration muss `observable:false` aktiv auf `null` ummappen, bevor der Zustand weitergereicht wird — sonst wandert eine stille `0°`/`0mm` in Richtung Robotersteuerung. - **Noch nicht an echten Kamerabildern/Markern validiert.** Die Zahlen oben sind Simulation aus appRobotRendering (saubere FK-Marker-Positionen, definierter Renderfehler-Rauschboden). Reale Marker-Ungenauigkeiten (s. `Kalibrierung_Marker.md`) und reale Kameranoise könnten andere `huber_delta_mm`/ `normal_weight`-Werte als die übernommenen Defaults verlangen. ## Besonderheiten - **Reiner, unveränderter Import-Stand** — momentan git-`??` (untracked), noch nicht in `homingOrchestrator.js`/`server.js` referenziert (nur `4b_revolute_angle.py` ist dort als `SCRIPT_4B` verdrahtet). - **Schema-Kompatibilität zur lokalen `3b_corner_marker_poses.py` bereits geprüft:** Feldnamen `marker_id`, `position_mm`/`position_m`, `normal`, `num_cameras` stimmen 1:1 — `load_observations()` braucht keine Anpassung. - **Namens-Kollision mit `5_camera_z_refine.py`** — zwei Skripte teilen sich das Präfix `5_`. Entspricht der Konvention aus appRobotRendering, wo mehrere Dateien sich ein Stufen-Präfix teilen (z. B. `3_*`, `4_*`); kein Bug, aber beim Lesen der `scripts/`-Liste leicht zu verwechseln. - **Die `pose_estimation.method`-Option erlaubt gezieltes A/B-Testen** ohne Codeänderung: `--method sequential_vector|sequential_fk|global_ba|hybrid` per CLI-Override, oder dauerhaft über `robot_1781069752019.json` → `pose_estimation.method`. Nützlich, um z. B. `hybrid` parallel zur bestehenden 4b-Kette laufen zu lassen und beide Ergebnisse zu vergleichen, bevor irgendetwas ersetzt wird. - **`finger_block_joints`/`per_link_method`** stehen schon (leer) in der robot.json — vorbereitete, aber im Skript bisher ungenutzte Erweiterungspunkte aus appRobotRendering. --- ## Aufruf (Stand-alone, zum Testen) ⚠️ Diese Aufrufe laufen **kalt** (kein externer Startwert — der Code-Hook dafür existiert noch nicht, s. Integrationsschritte). Geeignet, um das Kaltstart-/ Lokales-Minimum-Verhalten aus „Wichtige Einschränkung" zu beobachten und zu reproduzieren — **nicht** der vorgesehene Produktionspfad. ```bash python scripts/5_pose_estimation.py data/homing//aruco_marker_poses.json \ -robot scripts/robot_1781069752019.json \ -out data/homing//robot_state.json # Verfahren erzwingen, z.B. zum gezielten Vergleich einzelner Methoden: python scripts/5_pose_estimation.py data/homing//aruco_marker_poses.json \ -robot scripts/robot_1781069752019.json --method global_ba ``` --- ## Integrationsschritte (Offene Punkte) - [ ] **`scipy` in `docker-compose.yaml` ergänzen** (`pip3 install …` Zeile) — ohne das läuft `hybrid` lautlos auf Nullzustand. - [x] **Architektur entschieden:** 4b-Kette läuft zuerst und liefert den `accumulated_state` als Startwert; `5_pose_estimation.py` läuft danach als globaler Verfeinerungsschritt darüber. Kein Ersatz, keine parallele Alternative — siehe „Wichtige Einschränkung" oben. - [ ] **Code-Hook in `5_pose_estimation.py` ergänzen:** aktuell gibt es keinen Weg, einen externen Startwert hineinzugeben. Vorschlag: CLI-Flag analog zu 4b (`--from-state accumulated_state.json`), das den 4b-Zustand als `x0` direkt an `estimate_global_ba()` durchreicht (Parameter existiert dort bereits, `:236-237`) und so den internen `estimate_sequential_fk()`-Kaltstart in `estimate_pose()` (`:471-476`) umgeht bzw. nur als Fallback nutzt, falls kein externer Startwert übergeben wird. - [ ] Adapter `movements..value` → flaches `{x,…,e}`-State-Objekt für `POST /api/homing/send-state`; dabei `observable:false → null` ummappen. - [ ] Anbindung in `homingOrchestrator.js` (neuer Schritt, analog `runBoardPipeline`/ 4b-Loop) + SSE-Event(s) für Fortschritt (auch ohne echtes Zwischenergebnis, z. B. ein `step`-Event „läuft" / „fertig"). - [ ] Erste echte Messung: `hybrid`-Ergebnis gegen 4b-Kette auf demselben `data/homing//aruco_marker_poses.json` vergleichen (insbesondere am Ellbow-Fall aus `Homing_1_StepByStep.md`). - [ ] `huber_delta_mm`/`normal_weight` ggf. gegen reale Marker-Genauigkeit nachjustieren (Defaults sind aus appRobotRendering-Simulation übernommen). - [ ] Eintrag in `Homing.md`-Tabelle (Doku-Übersicht) ergänzen, sobald verdrahtet. --- ## Verweise - Allgemeiner Ablauf: [`Homing.md`](Homing.md) - Vorheriger Schritt (Kamera/Triangulation, liefert den gemeinsamen Input): [`Homing_0_Camera.md`](Homing_0_Camera.md) - Alternative/Ist-Zustand (4b-Kette, dieselbe Aufgabe anders gelöst): [`Homing_1_StepByStep.md`](Homing_1_StepByStep.md) - Ursprung & Validierung: Projekt **`appRobotRendering`**, `pipeline/pose_estimation.py` + `doc/pipeline.tex` (Abschnitte „Pose-Estimation: Vier Schätzverfahren" und „Validierung und Ergebnisse").