Farei limpeza avançada ou dados prontos para ML, do básico ao profissional

Algumas informações foram traduzidas automaticamente.

Índia

Eu falo Bengali, Hindi, Inglês

Cientista de Dados, Analytics, Python, SQL, ML, Especialista em Limpeza de Dados!

Olá! Eu sou Soham, cientista de dados e especialista em Python dedicado a ajudar empresas a desbloquear o verdadeiro potencial dos seus dados. Seja para modelos preditivos ou fluxos de trabalho automa...
Sobre este Serviço

Você precisa transformar seus dados bagunçados em um formato limpo, pronto para análise ou para machine learning?


Sou especialista em três níveis de limpeza de dados, desde correções básicas até pré-processamento avançado para modelos de ML.


LIMPEZA BÁSICA (Perfeito para relatórios e visualizações)

- Remover duplicados e colunas irrelevantes

- Tratar valores ausentes (excluir ou imputar de forma simples)

- Corrigir tipos de dados (datas, números, categorias)

  • Análise estatística

- Padronizar texto (maiúsculas, trim, remover espaços)


LIMPEZA AVANÇADA (Para análises profundas e dashboards)

- Tudo na limpeza básica +

- Análise de outliers (IQR, Z-score)

- Imputação avançada de valores ausentes (KNN, mediana, moda)

- Mesclar/juntar múltiplos conjuntos de dados

- Criar features derivadas (razões, agregados)

- Corrigir categorias inconsistentes e erros de codificação


DADOS PRONTOS PARA ML (Para treinamento de modelos)

- Tudo na limpeza avançada +

- Codificar variáveis categóricas (One-Hot, Label, Ordinal)

- Escalonamento de features (MinMax, StandardScaler, RobustScaler)

- Divisão em treino/validação/teste (70-20-10 ou personalizada)

- Tratar desequilíbrio de classes (oversampling/undersampling, se necessário)

- Remover vazamento de alvo

- Saída em formato compatível com TensorFlow ou sklearn


O QUE VOCÊ FORNECE:

- Arquivo(s) de dados brutos em CSV, Excel ou SQL.

-

Plataforma:

caderno Jupyter

Tecnologia de desenvolvimento:

Python

Power BI

Especialidade:

Formatação

Funções

gráficos

Limpeza