Vou construir soluções de OCR e visão computacional com python e opencv


Sobre este Serviço
Tradução automática
Precisa de OCR, classificação de imagens, detecção de objetos ou uma pipeline personalizada de visão computacional? Eu crio sistemas de CV de nível de produção que realmente funcionam fora de um Jupyter notebook.
O QUE EU ENTREGO:
OCR de documentos (faturas, recibos, formulários, texto manuscrito)
Classificação de imagens com CNNs personalizadas
Detecção e rastreamento de objetos (YOLO, detectron)
pipelines multimodais (OCR + NLP + pós-processamento LLM)
OCR para línguas indianas (hindi, marathi, scripts indicus)
Implantação em produção com Docker e APIs REST
O QUE VOCÊ RECEBE:
- Código Python limpo e documentado que você possui
- Pré-processamento ajustado para a qualidade da sua imagem
- Validação de precisão com seus dados reais
- Container Docker pronto para implantação (Premium)
- Endpoints de API REST (Padrão e Premium)
PILHA TECNOLÓGICA:
OpenCV, Tesseract, EasyOCR, PaddleOCR
TensorFlow, PyTorch, Keras
YOLO, Detectron2, CNNs personalizadas
FastAPI, Flask, Docker
MEU HISTÓRICO DE CV:
- Entreguei pipeline de vídeo Whisper + OCR na Sambhav AI (50% mais rápido, implantado no Kubernetes)
- Publiquei pesquisa de CNN na IJCNIS (classificador de câncer de pele, TPR de mais de 80%)
- Modelo de previsão de câncer de mama (97% de precisão em mais de 10 mil registros)
- Criei parser de fatura POS com OCR (ISKCON, ShopMind)
- GitHub: github.com/harshaldonarkar
Me envie uma mensagem
Conheça mais sobre Harshal D
AI Engineer: RAG Pipelines and LLM Integration Expert
- A partir deÍndia
- Membro desdeabr. de 2022
Idiomas
Hindi, Marata, Inglês
Tradução automática
Meu portfólio
Outros serviços de Desenvolvimento de IA que eu ofereço
Perguntas frequentes
Tradução automática
Qual qualidade de imagem eu preciso?
Recomendarei pré-processamento; a maioria das imagens do mundo real (fotos de celular, digitalizações, capturas de tela) funciona com o pipeline adequado. Envie amostras e eu te digo de antemão.
Você consegue lidar com texto manuscrito?
Sim — EasyOCR ou ajuste fino personalizado, dependendo do volume e do estilo de escrita. Compartilhe amostras para uma estimativa de precisão.
E o OCR para línguas indianas?
Sim — Hindi, marathi e outros scripts indus são suportados. Disponível como recurso Premium ou como extra pago nas versões Basic/Standard.
Você pode combinar OCR com pós-processamento LLM?
Com certeza — essa é uma das minhas forças. Extrair texto → entender o contexto → estruturar a saída. Ótimo para faturas, formulários e documentos não estruturados.
Você implanta o modelo ou apenas entrega o código?
Entregas básicas e padrão incluem código + API REST. A versão Premium inclui implantação com Docker, pronta para rodar no seu servidor ou nuvem.
Você pode treinar um modelo personalizado para meu conjunto de dados?
Sim — treinamento de CNNs personalizadas está incluso na versão Premium ou como extra. Preciso de dados rotulados de você.
Qual precisão posso esperar?
Depende muito dos seus dados. Para OCR de texto impresso limpo, mais de 95% é comum. Para imagens manuscritas ou degradadas, validamos primeiro com amostras.
Você trabalha com processamento de vídeo em tempo real?
Sim — detecção e rastreamento de objetos em streams de vídeo estão disponíveis como extra pago. Posso discutir taxa de quadros e requisitos de latência.

