Vou gravar conjunto de dados de fala em pashto ou dari para treinamento de IA


Sobre este Serviço
Tradução automática
Você está procurando por gravações de voz limpas, nativas em Pashto ou Persa/Dari para seus projetos de IA, reconhecimento de fala ou NLP?
Você está no lugar certo!
Vou gravar pronúncias de alta qualidade em Pashto ou Dari com precisão nativa, perfeito para treinar modelos de IA, fala para texto (STT) e sistemas ASR.
Vou fornecer a você:
- Áudio WAV/MP3 sem ruído
- Acentos nativos em Pashto e Persa/Dari
- Transcrição + rotulagem + metadados (CSV/Excel)
- Vários falantes disponíveis (mediante solicitação)
Seja você precisa de um conjunto de dados inicial pequeno ou de um corpus de fala em grande escala, posso entregar gravações rápidas, confiáveis e revisadas profissionalmente.
Vamos construir seu conjunto de dados de IA com clareza, precisão e confiança!
Conheça mais sobre Mansour Sadat
Innovative Frontend Web Developer and Fluent Trilingual Translator
- A partir deAfeganistão
- Membro desdejul. de 2024
- Responde em aprox.:1 hora
Idiomas
Inglês, Pashto, Persa
Tradução automática
Meu portfólio
Perguntas frequentes
Tradução automática
O que exatamente você fornece nas gravações?
Forneço pronúncias em Pashto ou Persa/Dari em áudio limpo, sem ruído (WAV/MP3). Dependendo do seu pacote, também incluo transcrição, rotulagem e metadados em formato CSV/Excel.
O que é metadata?
Metadados são informações estruturadas sobre cada arquivo de áudio (por exemplo, nome do arquivo, texto da pronúncia, ID do falante, duração). Isso torna seu conjunto de dados fácil de organizar e usar em projetos de IA/ML.
O que é transcrição?
Transcrição é a versão escrita do áudio, útil para treinar modelos de reconhecimento de fala.
O que é rotulagem?
Rotulagem significa marcar o conjunto de dados (por exemplo, por falante, gênero, tipo de pronúncia ou categoria) para que os modelos de IA possam reconhecer padrões de forma mais eficaz.
Posso solicitar múltiplos falantes?
Sim! Por padrão, gravo com um falante nativo, mas você pode pedir o serviço extra de “Falante adicional” para mais vozes.
E se eu precisar de um conjunto maior (milhares de pronúncias)?
Por favor, envie um pedido personalizado — posso ampliar e criar um conjunto de dados sob medida para seu projeto com a participação de vários falantes nativos.
Em quais formatos você entrega?
O áudio é entregue em WAV ou MP3, enquanto o texto/transcrição/metadados são entregues em TXT, CSV ou Excel, conforme sua preferência.

