Eu vou construir um pipeline rag na AWS bedrock para seus documentos e dados


Sobre este Serviço
Tradução automática
RAG é fácil de demonstrar e difícil de colocar em produção. A maioria dos projetos "converse com seus documentos" desmorona assim que usuários reais os usam. A recuperação traz trechos irrelevantes. As citações não apontam de volta para os documentos fonte. As janelas de contexto aumentam o custo por consulta. As respostas parecem alucinações porque a camada de recuperação nunca foi realmente ajustada. A demonstração funcionou. A produção não.
Eu construo RAG do jeito que engenheiros de backend constroem qualquer sistema de produção. Comece com o fragmento real do documento, não com os divisores padrão. Embeddings em pgvector ou OpenSearch com uma camada de recuperação que você consegue realmente depurar. Geração no AWS Bedrock com modelos Claude ou Titan. Rastreamento de citações para que as respostas apontem de volta para a fonte. Filtragem de metadados para que os usuários só recuperem de documentos que podem ver.
Tenho experiência prática com Bedrock pelo programa AWS AI and ML Scholars, além de profundidade em backend de produção por mais de 4 anos de envio de sistemas que lidam com tráfego real. O código de recuperação e geração é a parte interessante. A infraestrutura ao redor é a que decide se seu RAG realmente funciona em produção.
Me envie uma mensagem com o que você quer tornar consultável.
Conheça mais sobre Iloomnex
Senior backend engineer
- A partir dePaquistão
- Membro desdenov. de 2023
- Responde em aprox.:1 hora
- Última entrega1 ano
Idiomas
Inglês
Tradução automática
Meu portfólio
Perguntas frequentes
Tradução automática
Com que tipos de documentos você trabalha?
PDFs, documentos Word, markdown, texto simples, HTML e dados estruturados como CSVs ou JSON. Já trabalhei com conjuntos de documentos mistos, incluindo documentação técnica, contratos legais, bases de conhecimento internas e arquivos de tickets de suporte.
Por que AWS Bedrock em vez de OpenAI?
Bedrock faz sentido se você já usa AWS, precisa de modelos rodando na sua VPC para conformidade, quer acesso a várias famílias de modelos por uma única API (Anthropic Claude, Amazon Titan, Meta Llama, Cohere e outros), ou tem uma compra empresarial que prefere AWS.
