Sou Cientista de Dados e Engenheiro de Aprendizado de Máquina, especializado em transformar dados desorganizados em conjuntos de dados limpos e acionáveis. Ajudo empresas a economizar horas de trabalh...
Limpeza e higiene de dados: Detectar e remover linhas duplicadas, lidar com valores nulos ou ausentes usando métodos inteligentes de imputação, e eliminar recursos irrelevantes.
Correções estruturais e formatação: Padronizar datas, corrigir tipos de dados incorretos (por exemplo, converter números em texto para floats) e limpar strings de texto usando padrões regex personalizados.
Integração de dados: Mesclar, juntar e consolidar várias planilhas ou arquivos de dados diferentes em um único conjunto de dados mestre coeso.
Pré-processamento avançado para ML: Executar codificação categórica (One-Hot, Label ou Target encoding) e aplicar escalonamento/normalização de recursos adequado (MinMax ou Standard Scaling) otimizado para arquiteturas preditivas complexas.
Engenharia de recursos: Construir novas variáveis de interação e aplicar transformações matemáticas personalizadas para maximizar o sinal nos seus dados.