Vou desenvolver sistemas de rag de produção projetados para latência, custo e confiança


Sobre este Serviço
Tradução automática
A maioria dos chatbots RAG são apenas demonstrações em produção, parecem bem nas capturas de tela, mas desmoronam na terceira pergunta do usuário. Eu construo a versão que não desmorona.
Para equipes cuja demonstração (a sua, do ChatGPT ou de um freelancer) precisa se tornar algo que os usuários confiem.
𝗘𝗡𝗚𝗜𝗡𝗘𝗘𝗥𝗘𝗗 𝗔𝗚𝗔𝗜𝗡𝗦𝗧𝗦 𝗙𝗢𝗨𝗥 𝗕𝗨𝗗𝗚𝗘𝗧𝗦:
Retrieval BM25 + denso + reranker, precisão do contexto RAGAS > 0,75
Latência abaixo de 800ms para o tempo até o primeiro token, p95 abaixo de 2,5s
Custo típico de $0,0008 por consulta no gpt-4o-mini, modelado antecipadamente
Confiança na fidelidade > 0,85, citações de fontes, observabilidade por consulta
𝗣𝗥𝗢𝗢𝗙, 𝗡𝗢𝗧𝗔 𝗣𝗥𝗢𝗠𝗜𝗦𝗘𝗦
Cada versão vem com um relatório de avaliação contra seus documentos e suas perguntas e respostas. Se não atingir os limites acordados, você não paga os 30% finais. Por escrito.
𝗖𝗔𝗣𝗔𝗖𝗜𝗧𝗬
Duas versões de produção por mês. Se meu selo de resposta mostrar mais de 24h, estou cheio naquela semana.
𝗡𝗢𝗧 𝗙𝗢𝗥 𝗬𝗢𝗨 𝗜𝗙
Você está procurando wrappers de ChatGPT por menos de $200. Muitos desses reservam uma.
𝗡𝗘𝗫𝗧 𝗦𝗧𝗘𝗣
Envie uma declaração de problema de 1 parágrafo, um documento de exemplo e três perguntas de usuário. Eu respondo em até 24h com uma cotação fixa ou uma indicação.
Conheça mais sobre Anwar K
AI Software Engineer
- A partir dePaquistão
- Membro desdefev. de 2026
- Responde em aprox.:1 hora
Idiomas
Inglês
Tradução automática

