Vou construir agentes de IA, bots de web scraping e pipelines de extração de dados em python


Sobre este Serviço
Tradução automática
Para quem isso é indicado
- Fundadores e líderes de operações que precisam de dados recorrentes (monitoramento de preços, enriquecimento de leads, pesquisa de mercado)
- Pesquisadores e analistas que extraem dados estruturados de sites públicos ou PDFs
- Equipes de ML e IA que coletam dados para treinamento
- Agências cujos clientes solicitam "raspar isso pra gente" e precisam de um subcontratado confiável
O que eu construo
- Web scrapers em Python (Scrapy, BeautifulSoup, Playwright) ou Node (Playwright, Puppeteer)
- Parsing com IA usando OpenAI ou Claude, para transformar páginas não estruturadas em JSON tipado, e não em uma confusão de regex
- Pipelines de dados recorrentes com agendamento, deduplicação, detecção de mudanças e alertas
- Extração de PDFs, documentos e OCR quando os dados não estão na página
Pilha de tecnologias
Python, JavaScript, TypeScript, Scrapy, BeautifulSoup, Playwright, Puppeteer, Selenium, requests, httpx, Pandas, OpenAI
API, API do Anthropic Claude, chamadas de funções e saídas estruturadas, PostgreSQL, MongoDB, Supabase, Airtable, Google Sheets
Conheça mais sobre Hamza Khan
Experienced Full Stack AI Developer
- A partir dePaquistão
- Membro desdefev. de 2020
- Responde em aprox.:6 horas
- Última entrega1 ano
Idiomas
Inglês, Hindi, Italiano, Francês
Tradução automática
Meu portfólio
Outros serviços de Desenvolvimento de Software que eu ofereço
Perguntas frequentes
Tradução automática
Qual a diferença entre raspagem regular e "extração com IA"?
Raspagem regular usa seletores CSS/XPath que quebram assim que o layout do site muda. Extração com IA usa Claude ou GPT para ler a página como um humano e retornar JSON estruturado de acordo com seu esquema. É mais resistente, lida com layouts confusos e permite extrair campos semânticos.
A raspagem ainda vai funcionar após a atualização do site?
Extrações com IA são resistentes à maioria das mudanças de layout. Raspadores baseados em seletores não são — se o site reescrever seu HTML, o raspador precisa de manutenção. A camada Premium inclui 14 dias de correções gratuitas; depois, ofereço uma taxa de manutenção.
Quais sites você consegue extrair?
Sites públicos cujo Termos de Serviço permitem acesso automatizado, ou onde os dados são explicitamente públicos (catálogos de produtos, listagens imobiliárias, dados governamentais, notícias, perfis públicos em sites profissionais com políticas claras de scraping, etc.). Na ligação de escopo, revisarei seu alvo.
