Vou fazer reconhecimento de fala automático, consultoria de fala para texto

D
djimenez_ml
D
djimenez_ml
David J
Algumas informações foram traduzidas automaticamente.

Sobre este Serviço

Tradução automática

Quer integrar reconhecimento de fala, comandos de voz ou IA conversacional no seu projeto? Tô aqui pra te ajudar! Com experiência em tecnologias de reconhecimento de fala de ponta, como Whisper, Wav2vec, Kaldi, Vosk, phi4, MMS, seamless-m4t, DeepSpeech, entre outras, ofereço consultorias personalizadas para te orientar na implementação, otimização e resolução de problemas.

Eu me especializo em:

  • Projetar e implementar soluções de reconhecimento de fala
  • Escolher as melhores APIs (Deepgram, AssemblyAI, Gemini, OpenAI, Google Speech-to-Text, etc.)
  • Treinar e ajustar modelos de fala de última geração
  • Melhorar a precisão para idiomas ou dialetos específicos
  • Resolver desafios em ambientes barulhentos
  • Diariização de falantes
  • Detecção de atividade de voz
  • Detecção de eventos sonoros

Vamos conversar sobre suas necessidades e transformar suas ideias em realidade!

Conheça mais sobre David J

David J

Speech Recognition

5,0(7)
  • A partir deEspanha
  • Membro desdenov. de 2024
  • Responde em aprox.:1 dia
  • Última entrega1 semana
  • Idiomas

    Espanhol, Inglês
I have +6 year of experience working with machine learning and deep learning applied to speech recognition: - Speech to text, - Diarization, - Voice Activity Detection, - Sound Event Detection, - Denoising, - Audio Signal Processing, - Emotion... in different languages. I have been working with SOTA Automatic Speech Recognition APIs and frameworks: Whisper, Kaldi, Vosk, MMS, DeepSpeech, speechbrain and wav2vec2. I have been working to fine-tuned models to improve WER and speed inference on multiple language. Hugging Face: https://huggingface.co/deepdml Github: https://github.com/djpg

Tradução automática

Meu portfólio