Vou construir soluções de OCR e visão computacional com python e opencv

H
harshaldonarkar
H
harshaldonarkar
Harshal D
Algumas informações foram traduzidas automaticamente.

Sobre este Serviço

Tradução automática

Precisa de OCR, classificação de imagens, detecção de objetos ou uma pipeline personalizada de visão computacional? Eu crio sistemas de CV de nível de produção que realmente funcionam fora de um Jupyter notebook.


O QUE EU ENTREGO:

OCR de documentos (faturas, recibos, formulários, texto manuscrito)

Classificação de imagens com CNNs personalizadas

Detecção e rastreamento de objetos (YOLO, detectron)

pipelines multimodais (OCR + NLP + pós-processamento LLM)

OCR para línguas indianas (hindi, marathi, scripts indicus)

Implantação em produção com Docker e APIs REST


O QUE VOCÊ RECEBE:

- Código Python limpo e documentado que você possui

- Pré-processamento ajustado para a qualidade da sua imagem

- Validação de precisão com seus dados reais

- Container Docker pronto para implantação (Premium)

- Endpoints de API REST (Padrão e Premium)


PILHA TECNOLÓGICA:

OpenCV, Tesseract, EasyOCR, PaddleOCR

TensorFlow, PyTorch, Keras

YOLO, Detectron2, CNNs personalizadas

FastAPI, Flask, Docker


MEU HISTÓRICO DE CV:

- Entreguei pipeline de vídeo Whisper + OCR na Sambhav AI (50% mais rápido, implantado no Kubernetes)

- Publiquei pesquisa de CNN na IJCNIS (classificador de câncer de pele, TPR de mais de 80%)

- Modelo de previsão de câncer de mama (97% de precisão em mais de 10 mil registros)

- Criei parser de fatura POS com OCR (ISKCON, ShopMind)

- GitHub: github.com/harshaldonarkar


Me envie uma mensagem

Conheça mais sobre Harshal D

Harshal D

AI Engineer: RAG Pipelines and LLM Integration Expert

  • A partir deÍndia
  • Membro desdeabr. de 2022
  • Idiomas

    Hindi, Marata, Inglês
AI Engineer with 2 published research papers (IJCNIS, IRJET) and production deployments. Previously at Sambhav AI where I built Whisper+OCR pipelines and multimodal AI — delivered 50% performance gains. I specialize in RAG systems with LangChain, LLM integration (GPT-4, Claude, Gemini), computer vision with OpenCV, OCR pipelines, and production ML deployment with Docker. I ship working code, not prototypes. Portfolio: harshaldonarkar.github.io | GitHub: harshaldonarkar

Tradução automática

Meu portfólio

Outros serviços de Desenvolvimento de IA que eu ofereço