Vou corrigir erros do mediapipe GPU delegate no arm linux, docker ou headless

R
richter1976
R
richter1976
Richter
Algumas informações foram traduzidas automaticamente.

Sobre este Serviço

Tradução automática

O MediaPipe GPU delegate está falhando no seu dispositivo ARM, container Docker ou servidor headless?


Erros comuns que eu corrijo:

"Falha ao criar o contexto base ao abrir o driver do kernel"

"eglGetDisplay() retornou EGL_NO_DISPLAY"

"O módulo do kernel pode não ter sido carregado"

O delegate de GPU silenciosamente recua para CPU sem erro

MediaPipe funciona no desktop, mas trava no edge/embedded


Compilei o MediaPipe 0.10.35 a partir do código Bazel com o GPU delegate EGL/GBM no GPU Mali ARM rodando totalmente headless (sem X11, sem Wayland, sem Xvfb). Consegui uma velocidade 2,3x maior que a CPU.


O que a maioria dos vendedores não sabe:

O mediapipe GPU delegate usa EGL, NÃO CUDA mesmo no Jetson

EGL requer um servidor de display por padrão, mas eu modifiquei para usar GBM (Gerenciamento de Buffer Genérico) para um verdadeiro headless

Isso funciona em Mali (RK3576/RK3588), VideoCore (RPi 5) e GPUs Adreno


Demonstração ao vivo (gravação de terminal): https://asciinema.org/a/Mv4LEGvaroBSs6oJ


Eu faço:

Compilação ARM aarch64 a partir do código (Bazel + CMake)

Pass-through de GPU no Docker para MediaPipe

Patch de EGL/GBM headless

Benchmark de desempenho (CPU vs GPU)


Plataforma: Python 3.10-3.12, Linux ARM64, compatível com Docker


Conheça mais sobre Richter

Richter
4,8(4)
  • A partir deChina
  • Membro desdeout. de 2024
  • Última entrega1 ano
  • Idiomas

    Chinês, Alemão, Inglês
I build computer vision systems that ship — on NVIDIA CUDA servers and ARM edge. Not demos. Production. 6 projects deployed in 12 months: YOLO detection + tracking on CUDA and NPU (17x speedup), multi-camera RTSP pipelines with FFmpeg hardware decoding, MediaPipe GPU compiled from source for ARM Mali (2.3x faster, headless), PyTorch custom model training, and rPPG contactless vital signs from video. Stack: Python, C++, PyTorch, OpenCV, CUDA, ONNX, YOLO, Docker. GPUs: RTX 4060 Ti, Hailo-8L NPU, Mali-G52. 3600+ lines in a real school. 20K+ lines in a shipping edge AI product.

Tradução automática

Meu portfólio

Tags relacionadas