Eu vou construir um pipeline rag na AWS bedrock para seus documentos e dados

I
iloomnex
I
iloomnex
Iloomnex
Algumas informações foram traduzidas automaticamente.

Sobre este Serviço

Tradução automática

RAG é fácil de demonstrar e difícil de colocar em produção. A maioria dos projetos "converse com seus documentos" desmorona assim que usuários reais os usam. A recuperação traz trechos irrelevantes. As citações não apontam de volta para os documentos fonte. As janelas de contexto aumentam o custo por consulta. As respostas parecem alucinações porque a camada de recuperação nunca foi realmente ajustada. A demonstração funcionou. A produção não.

Eu construo RAG do jeito que engenheiros de backend constroem qualquer sistema de produção. Comece com o fragmento real do documento, não com os divisores padrão. Embeddings em pgvector ou OpenSearch com uma camada de recuperação que você consegue realmente depurar. Geração no AWS Bedrock com modelos Claude ou Titan. Rastreamento de citações para que as respostas apontem de volta para a fonte. Filtragem de metadados para que os usuários só recuperem de documentos que podem ver.

Tenho experiência prática com Bedrock pelo programa AWS AI and ML Scholars, além de profundidade em backend de produção por mais de 4 anos de envio de sistemas que lidam com tráfego real. O código de recuperação e geração é a parte interessante. A infraestrutura ao redor é a que decide se seu RAG realmente funciona em produção.

Me envie uma mensagem com o que você quer tornar consultável.

Conheça mais sobre Iloomnex

Iloomnex

Senior backend engineer

5,0(11)
  • A partir dePaquistão
  • Membro desdenov. de 2023
  • Responde em aprox.:1 hora
  • Última entrega1 ano
  • Idiomas

    Inglês
Senior backend engineer, 4+ years shipping production systems. I build Node.js and NestJS backends on AWS serverless. Lambda, SQS, EventBridge, Step Functions. I handle the integrations most devs avoid: Amazon SP-API, Shopify, QuickBooks, Xero, and LLMs via Bedrock, OpenAI, and Claude. Day job is a multi-tenant HRIS and payroll platform running real traffic. On Fiverr as iLoomNex, I take on backend builds, API integrations, and AI features that need to work in production, not just in a demo. Always online. Reply in under an hour. Any timezone.

Tradução automática

Meu portfólio