Sou engenheiro de Deep Learning especializado em Compressão de Modelos e Implantação em Edge. Vou transformar seus modelos de pesquisa de alta precisão em ativos prontos para produção, otimizados para dispositivos móveis, web e IoT.
O que eu ofereço:
- Conversão de Modelos: Converter de forma fluida entre frameworks, incluindo PyTorch para ONNX, Keras para TFLite ou TensorFlow para CoreML.
- Otimização de Inferência: Acelere seu modelo usando TensorRT, OpenVINO ou ONNX Runtime.
- Compressão de Modelos: Reduza o tamanho usando Quantização Pós-Treinamento (INT8/Float16) e Poda de Pesos sem perder precisão significativa.
- Implantação em Edge: Otimização para hardware como Raspberry Pi, Android (TFLite), iOS (CoreML) e NVIDIA Jetson.
- Refinamento de Arquitetura: Implementando Knowledge Distillation para criar modelos "estudantes" eficientes.
Por que escolher este serviço?
- Especialização em arquiteturas SOTA: Experiência com YOLO (v8-v11), Transformers (ViT), MobileNet e EfficientNet.
- Benchmarking de desempenho: Você recebe um relatório detalhado mostrando Latência, Throughput e Uso de memória antes e depois da otimização.
- Implementação limpa: Scripts de integração em Python ou C++ totalmente documentados.
Ferramentas & Frameworks:
PyTorch | TensorFlow | Keras | ONNX | TFLite