Eu construirei modelos personalizados de reconhecimento de fala ou emoção

Algumas informações foram traduzidas automaticamente.

Bangladesh

Eu falo Inglês

1 pedido finalizado

Especialista em IA/ML com habilidades em NLP, Visão Computacional e LLMs. Construo sistemas inteligentes de NLP usando modelos multimodais para reconhecimento de emoção na fala, deep CNNs (VGG16/VGG19...
Sobre este Serviço

Sobre Este Gig


Sou especialista em construir sistemas multimodais de reconhecimento de fala e emoção combinando modalidades de áudio e texto para melhorar desempenho e precisão.

Com experiência prática em trabalhar com conjuntos de dados complexos como IEMOCAP e MELD, desenvolvi modelos híbridos personalizados usando Bi-LSTM e CNN, alcançando até 85% de precisão no conjunto de dados IEMOCAP. Também estou explorando ativamente Word2Vec e arquiteturas baseadas em Transformers para uma compreensão contextual aprimorada na fala.

Você pode conferir meus projetos e artigos de pesquisa linkados abaixo para mais detalhes.


O que eu ofereço:

  1. Pré-processamento de conjuntos de dados complexos de áudio e texto
  2. Desenvolvimento de modelos personalizados (LSTM, CNN, Transformers, etc.)
  3. Ajuste de hiperparâmetros e otimização de modelos
  4. Suporte para teses acadêmicas, pesquisas ou projetos industriais
  5. Soluções prontas para integração em apps ou APIs



Sinta-se à vontade para me enviar uma mensagem antes de fazer seu pedido para discutir suas necessidades específicas.


Especialidade:

Classificação

Fala e áudio

Análise preditiva

Linguagem de programação:

Python

Colab

APIs:

Outros

Ferramentas:

caderno Jupyter

Amazon SageMaker

Colab

Frameworks:

Scikit-learn

keras

PyTorch

Panda

fluxo tensor

Meu portfólio

Outros serviços de Ciência de dados e ML que eu ofereço

Tags relacionadas