Roadmap & CSS

This commit is contained in:
chk
2026-06-07 12:01:39 +02:00
parent 0a36b21996
commit 39fa6d07f5
2 changed files with 221 additions and 183 deletions

View File

@@ -1,206 +1,240 @@
# 📦 Re-Render & Compress
# 📦 Re-Render & Compress (H.264)
> Status: **Entwurf / noch nichts implementiert.** Alle Zahlen unten sind
> Hypothesen, bis sie auf dem Host gemessen sind (siehe Phase 0).
## Problem
Der aktuelle Video-Stream (insbesondere 1080p MJPEG) erzeugt **sehr hohe Datenraten (~30 MBit/s)**.
Das führt zu Problemen bei:
MJPEG überträgt jedes Frame als vollständiges JPEG → die Bandbreite skaliert
linear mit Auflösung × Framerate × Clients. Bei höheren Auflösungen oder mehreren
gleichzeitigen Clients kann das im WAN / mobil teuer werden.
- mobiler Nutzung (Bandbreite / Datenvolumen)
- mehreren gleichzeitigen Clients
- schwachen Netzwerken
⚠️ **Wichtig aktuelle Realität prüfen, nicht annehmen:**
Die Live-Streams laufen derzeit auf **320×240** (`liveSize` pro Kamera in
[cameras.json](../cameras.json)), **nicht** 1080p. Das `1920x1080` dort ist die
**`hiresSize`** — also das *Einzelbild* beim HD-Knopf bzw. im Snapshot-Modus, kein
Dauerstream. Die oft zitierten „~30 MBit/s" gelten also bestenfalls für einen
hypothetischen 1080p-Dauerstream, nicht für den heutigen Betrieb.
👉 Bevor hier irgendwas gebaut wird, gilt **Phase 0: messen**. Ohne belastbare
Bandbreiten-Zahl ist unklar, ob sich der ganze Umbau überhaupt lohnt.
## Ziel
Reduktion der Bandbreite durch **optionale Hardware-basierte Neukodierung**:
Reduktion der Bandbreite durch **optionale, pro Kamera schaltbare** Neukodierung
MJPEG → H.264 (GPU), **ohne** die schlanke Default-Architektur (Node besitzt die
Kameras, MJPEG-Passthrough, `<img>`-Viewer) für den LAN-Fall aufzugeben.
- Eingangsformat: MJPEG (von der Webcam)
- Zielformat: H.264 (deutlich effizienter)
👉 Zielbitrate: ~25 MBit/s bei vergleichbarer wahrgenommener Qualität
Zielbitrate (Hypothese): ~25 MBit/s bei vergleichbarer wahrgenommener Qualität.
---
## Lösungsansatz
## ⚠️ Der eigentliche Knackpunkt zuerst: Wiedergabe im Browser
Zwei Betriebsmodi sollen flexibel unterstützt werden:
Das ist der Teil, der den Umbau groß macht — und der im ersten Entwurf als
„UI-Checkbox" verharmlost war.
### 1. 🟢 Unkomprimierter Modus (Default)
- MJPEG bleibt unverändert
- minimale Latenz
- keine GPU-Abhängigkeit
Der aktuelle Viewer rendert den Stream in einem **`<img>`**
([public/viewer.js](../public/viewer.js)), gespeist aus
`multipart/x-mixed-replace` ([src/snapshotService.js](../src/snapshotService.js)).
Ein `<img>` kann **ausschließlich MJPEG** darstellen.
> **H.264 läuft niemals in einem `<img>`.** „Der Browser soll mit beidem umgehen"
> ist daher kein Schalter, sondern ein **zweiter, vollständiger Wiedergabe-Pfad.**
H.264 + MJPEG schließen sich auch im Transport gegenseitig aus — H.264 lässt sich
nicht in MJPEG-multipart verpacken. Es braucht einen eigenen Container und einen
eigenen Player. Optionen:
| Transport | Client | Aufwand | Latenz (Erwartung, zu messen) |
|-----------|--------|---------|-------------------------------|
| **MSE (fMP4)** | `<video>` + `MediaSource` + JS-Feeder | mittel | gut, mit Low-Latency-Tuning; sonst 200 ms1 s Puffer |
| **WebRTC** | `RTCPeerConnection` + Signaling | hoch | am niedrigsten |
| HLS/DASH | `<video>` / hls.js | gering | Sekunden — für Live untauglich |
**Achtung Déjà-vu:** WebRTC + H.264 ist genau das, was go2rtc gemacht hat und
was bewusst entfernt wurde (siehe Architektur-Doku). WebRTC würde Signaling-
Infrastruktur wieder einführen. **Empfehlung: MSE-fMP4**, weil es die „Node besitzt
die Kameras"-Architektur erhält (Node → ffmpeg → Byte-Stream → Browser) und keine
ICE/STUN/TURN-Maschinerie braucht. Endgültige Wahl erst nach der Latenz-Messung
(Phase 0).
### MSE-Besonderheit: Init-Segment für späte Clients
Anders als bei MJPEG (jedes Frame eigenständig) muss bei fragmentiertem MP4 ein
Client, der **mitten im Stream** dazukommt, zuerst das **Init-Segment**
(`ftyp`+`moov`) bekommen, dann die Media-Fragmente. Der Server muss das
Init-Segment also **zwischenspeichern** und jedem neuen Client zuerst schicken,
bevor er ihn in den Fan-out hängt. Das ist neue Logik gegenüber dem heutigen
„jedes Frame an jeden"-Modell.
---
## Lösungsansatz: zwei Modi pro Kamera
### 1. 🟢 MJPEG-Passthrough (Default, unverändert)
- bestehender Pfad: `copybsf``mpjpeg``multipart``<img>`
- minimale Latenz, keine GPU-Abhängigkeit, ~5 % idle-CPU
- ideal im LAN / bei wenigen Clients
### 2. 🔵 Komprimierter Modus (optional)
- MJPEG → H.264 via GPU-Encoding
- drastisch reduzierte Bandbreite
- geeignet für:
- mobile Clients
- WAN-Zugriff
- mehrere parallele Streams
### 2. 🔵 H.264 (optional, GPU)
- MJPEG → H.264 (VAAPI/QSV) → fMP4 → MSE-`<video>`
- drastisch reduzierte Bandbreite, für mobil / WAN / viele Clients
- höhere Komplexität + GPU-Abhängigkeit + (zu messende) Zusatzlatenz
👉 **Wichtig:** Kompression muss pro Kamera konfigurierbar sein.
---
## Hardware-Bewertung
### 🖥️ Intel UHD 630 (Coffee Lake)
**Unterstützung:**
- VAAPI
- Quick Sync Video (H.264/H.265)
**Leistung:**
- 12 Streams stabil
- niedrige CPU-Auslastung bei aktivem VAAPI
**Einschränkungen:**
- ältere Hardware
- limitiert bei:
- hoher Bitrate
- vielen Clients
**Praxis:**
- 30 MBit MJPEG → stabil auf ~35 MBit H.264 reduzierbar
---
### 🖥️ AMD Radeon 680M (Rembrandt)
**Unterstützung:**
- VAAPI
- VCN 3.x Hardware Encoder
**Vorteile:**
- deutlich bessere Encoding-Performance
- höhere Effizienz
- gut geeignet für mehrere Streams
**Praxis:**
- mehrere parallele Re-Encodes in Echtzeit möglich
Der Browser wählt **pro Kamera** anhand der Server-Metadaten den richtigen Player
(`<img>` oder `<video>`).
---
## Architektur-Entscheidung
- Encoding erfolgt **im Server (FFmpeg + GPU)**
- Kamera liefert weiterhin MJPEG
- Pipeline entscheidet dynamisch:
- Encoding erfolgt **direkt in Node via FFmpeg + GPU** (kein go2rtc mehr).
- Kamera liefert weiterhin MJPEG; der `CameraSwitch` bleibt einziger Geräte-Öffner.
- Der Modus hängt am **vorhandenen `encode`-Feld** (siehe Konfigurationsmodell).
```
Camera (MJPEG)
FFmpeg
[ optional ]
H.264 Encoding (GPU)
Client
Kamera (MJPEG, v4l2)
┌─┴─────────────────────────── encode = 'copybsf' | 'mjpeg'
ffmpeg -c:v copy -bsf mjpeg2jpeg -f mpjpeg
│ → multipart/x-mixed-replace → <img> (heutiger Pfad, unverändert)
└───────────────────────────── encode = 'h264'
ffmpeg -c:v h264_vaapi -f mp4 (fragmentiert)
→ Byte-Stream (+ gecachtes Init-Segment) → MSE → <video> (neu)
```
---
## Konfigurationsmodell
Pro Kamera:
**Kein neues `compress`-Flag** — das würde sich mit dem bestehenden Encode-Schalter
überschneiden. Stattdessen das vorhandene `encode`-Feld erweitern, das in
[server.js](../server.js) und [src/cameraSwitch.js](../src/cameraSwitch.js) bereits
pro Kamera verdrahtet ist:
-`stream`: an/aus
-`compress`: an/aus (neu)
| `encode` | Bedeutung |
|----------|-----------|
| `copybsf` | Default, Bitstream-Copy, niedrigste CPU (heute) |
| `mjpeg` | Re-Encode MJPEG→MJPEG, Fallback (heute) |
| `h264` | **neu:** GPU-H.264 → fMP4 (VAAPI/QSV, Auto-Erkennung) |
Beispiel:
Beispiel `cameras.json`:
```json
{
"camera": "cam1",
"id": "cam2",
"device": "/dev/video4",
"stream": true,
"compress": true
"encode": "h264",
"liveSize": "640x480"
}
```
---
## Technische Integration
### 1. GPU in Docker verfügbar machen
- Unterstützung für:
- Intel (VAAPI: `/dev/dri`)
- AMD (ebenfalls VAAPI)
- dynamische Erkennung statt Hardcoding
`hiresEncode` bleibt davon unberührt (HD-Snapshot bleibt JPEG — sinnvoll, da ein
Einzelbild bandbreiten-unkritisch ist).
---
### 2. FFmpeg-Pipeline erweitern
## Technische Integration (was wirklich zu tun ist)
Aktuell:
- MJPEG → MJPEG (copy oder re-encode)
Neu:
- optionaler Pfad:
### 1. GPU in den Container durchreichen
- `/dev/dri` ins Docker-`devices` (wie in [doc/02_HardwareEncoding.md](02_HardwareEncoding.md) für die Intel-Box bestätigt: `/dev/dri/renderD128` vorhanden).
- Encoder dynamisch wählen (`h264_vaapi` vs. `h264_qsv`) statt Hardcoding.
### 2. FFmpeg-H.264-Profil (Node spawnt direkt — `#hardware` von go2rtc gibt es nicht mehr)
Skizze (VAAPI, Werte in Phase 1 zu tunen/messen):
```bash
MJPEG → H.264 (h264_vaapi / h264_qsv)
ffmpeg -fflags nobuffer \
-f v4l2 -input_format mjpeg -video_size 640x480 -framerate 30 -i /dev/video4 \
-vaapi_device /dev/dri/renderD128 -vf 'format=nv12,hwupload' \
-c:v h264_vaapi -b:v 3M -g 60 \
-f mp4 -movflags +frag_keyframe+empty_moov+default_base_moof -frag_duration 100000 \
pipe:1
```
- MJPEG-**Decode** bleibt vorerst CPU (USB-MJPEG via VAAPI dekodieren ist wackelig)
→ die „nur GPU"-Erwartung in Phase 0/1 **messen**, nicht annehmen.
- Kurze GOP (`-g`) + `frag_duration` klein = niedrige Latenz, mehr Overhead → Trade-off messen.
### 3. `CameraSwitch` erweitern ([src/cameraSwitch.js](../src/cameraSwitch.js))
Nicht „nur neue Args" — betroffen sind mehrere Stellen:
- `videoOutArgs()` um den `h264`-Zweig erweitern (anderer Muxer als `-f mpjpeg`).
- Der `MpjpegParser` ist MJPEG-spezifisch und greift hier **nicht**; für fMP4 wird
der Byte-Stream durchgereicht (Init-Segment cachen, Media-Fragmente fan-out).
- On-Demand / idle-Stop / Auto-Restart gelten weiter — die Pipeline startet wie
heute erst bei Verbrauchern.
### 4. Neue Stream-Route ([src/snapshotService.js](../src/snapshotService.js))
- `createStreamRouter` sendet heute `multipart/x-mixed-replace`. Für H.264 braucht
es eine Variante (oder zweite Route), die `video/mp4` als fortlaufenden
Byte-Stream liefert und neuen Clients zuerst das Init-Segment schickt.
- `/api/cameras` muss den Modus (`mjpeg`|`h264`) mitliefern, damit der Viewer den
Player wählen kann.
### 5. Viewer erweitern ([public/viewer.js](../public/viewer.js))
- Bei `encode==='h264'`: `<video>` + `MediaSource` + SourceBuffer-Feeder statt `<img>`.
- **Auto-Fallback statt schwarzem Bild:** client-seitig
`MediaSource.isTypeSupported('video/mp4; codecs="avc1.42E01E"')` prüfen; bei
fehlender Unterstützung sichtbare Meldung + automatischer Rückfall auf MJPEG,
nicht stilles Schwarz.
### 6. UI ([public/config.html](../public/config.html))
- Statt Checkbox „Compress": Dropdown/Select für `encode` (copybsf / mjpeg / h264).
---
### 3. Stream-Handling erweitern
## Hardware-Bewertung (Erwartung — in Phase 0/1 zu bestätigen)
- bestehende Logik (`camera_switch.js`) bleibt intakt
- Erweiterung:
- Encoding-Mode abhängig von `compress`
- neue FFmpeg-Args
### 🖥️ Intel UHD 630 (Coffee Lake) — die heutige Box
- VAAPI / Quick Sync (H.264/H.265), `/dev/dri/renderD128` bestätigt.
- Erwartung: 12 H.264-Streams stabil, niedrige CPU bei GPU-Encode.
---
### 4. UI erweitern
In `config.html`:
- Checkbox:
```
[ ] Compress Stream (H.264)
```
### 🖥️ AMD Radeon 680M (Rembrandt) — falls Zielhardware
- VAAPI / VCN 3.x; erwartet deutlich mehr Encode-Reserve.
- ⚠️ **Erst prüfen, ob diese Box überhaupt Ziel ist** und ob `/dev/dri` + VAAPI dort
laufen — die bisherige Doku basiert auf der Intel-Box.
---
## Design-Prinzipien
- ✅ **Backward-compatible** (Default: kein Encoding)
- ✅ **Low latency bleibt möglich**
- ✅ **Hardware optional**
- ✅ **Pro Kamera steuerbar**
- ✅ **Minimal CPU overhead**
-**Backward-compatible** — Default bleibt MJPEG, nichts ändert sich für LAN.
-**Pro Kamera schaltbar** über das vorhandene `encode`-Feld.
-**Node behält die Kameras** — kein go2rtc/WebRTC-Rückbau.
- ⚠️ **Low latency** nur, wenn die Messung es bestätigt (MSE puffert).
- ⚠️ **GPU optional** — H.264-Kameras hängen an funktionierendem VAAPI/QSV.
---
## Offene Punkte
## Offene Entscheidungen
- H.264 → Rückgabeformat:
- weiterhin MJPEG für Browser?
- oder direkt Stream (z.B. mpegts / WebRTC)?
>> das video soll entweder komprimiert oder unverändert zum browser kommen, je nachdem wie der Haken gesetzt ist. Der Browser soll mit beidem umgehen können.
- Latenz vs. Kompression:
- Encoding erhöht minimal die Verzögerung. Das muss getestet werden, deshalb die Option es unverändert zu lassen.
- Client-Kompatibilität:
- MJPEG: universell
- H.264: effizient, aber Wrapper nötig
Falls Browser das nicht unterstützt, wird die Darstellung schwarz. Dann kann die
Konfiguration "Kompression" abgeschaltet werden.
1. **Lohnt es sich überhaupt?** → Phase 0 (Bandbreite der realen Live-Streams messen).
2. **Transport: MSE-fMP4 (empfohlen) oder WebRTC?** → entscheidet Latenz + Aufwand,
abhängig von Phase-0-Messung.
3. **Decode auf CPU oder GPU?** → messen, ob USB-MJPEG-VAAPI-Decode stabil ist.
4. **Zielhardware Intel-Box oder AMD 680M?**
---
## nächste Schritte (ToDo)
## Nächste Schritte (ToDo — ehrlicher Stand: nichts erledigt)
1. ✅ GPU-Passthrough in Docker implementieren
2. ✅ FFmpeg-Encoding-Profil definieren (VAAPI / QSV)
3. ✅ `CameraSwitch` um Encoding-Modus erweitern
4. ✅ Config um `compress` erweitern
5. ✅ UI-Checkbox hinzufügen
6. 🔄 Tests mit:
- Intel UHD 630
- AMD 680M
7. 🔄 Bandbreite & CPU vergleichen
**Phase 0 — Messen (Vorbedingung, blockiert alles andere)**
1. 🔲 Bandbreite der heutigen Live-Streams (320×240 bzw. konfigurierte `liveSize`) auf dem Host messen, bei 1 und bei n Clients.
2. 🔲 Hypothese 1080p-Stream gegen die echte Zielauflösung abgleichen — lohnt der Umbau?
3. 🔲 Transport-Latenz-Test: ein Test-fMP4-Stream (MSE) vs. heutiges MJPEG, Methode wie in [doc/03_Protocoll_roadmap.md](03_Protocoll_roadmap.md) (Stoppuhr-Foto).
**Phase 1 — Encode-Pfad (nur wenn Phase 0 positiv)**
4. 🔲 `/dev/dri`-Passthrough + VAAPI/QSV-Auto-Erkennung.
5. 🔲 FFmpeg-H.264-fMP4-Profil definieren; CPU/GPU/Latenz auf dem Host messen.
**Phase 2 — Server**
6. 🔲 `encode='h264'` in `videoOutArgs` / `CameraSwitch` (inkl. Init-Segment-Cache + Byte-Stream-Fan-out).
7. 🔲 H.264-Stream-Route + Modus in `/api/cameras`.
**Phase 3 — Client**
8. 🔲 MSE-`<video>`-Player + Feature-Detection + Auto-Fallback auf MJPEG.
9. 🔲 `config.html`: `encode`-Auswahl.
**Phase 4 — Verifikation**
10. 🔲 Bandbreite & CPU/GPU vorher/nachher vergleichen (gemessen, auf dem Host).