Vou auditar e otimizar sua pipeline RAG para uma recuperação melhor


Sobre este Serviço
Tradução automática
Sua pipeline RAG busca trechos errados e seu LLM hallucina. O problema não é o modelo. É a recuperação.
Eu otimizo sistemas RAG com mais de 9 anos de experiência em engenharia de relevância de busca. A maioria das falhas do RAG são falhas na recuperação, e eu as conserto na origem.
O que eu conserto:
- Estratégias ruins de chunking que dividem o contexto
- Seleção errada do modelo de embedding
- Falta de etapa de reranking
- Busca híbrida ausente (palavra-chave + vetor combinados)
- Ausência de métricas de avaliação de recuperação
O que você recebe:
- Avaliação da qualidade da recuperação com métricas antes/depois
- Otimização da estratégia de chunking para seus dados
- Avaliação e recomendação do modelo de embedding
- Configuração do pipeline de reranking (cross-encoder ou ColBERT)
- Implementação de busca híbrida (BM25 + vetor + RRF)
- Estrutura de avaliação (precisão, recall, NDCG, MRR)
Trabalho com qualquer stack: LangChain, LlamaIndex, pipelines personalizados. Armazenamentos de vetor: Elasticsearch, OpenSearch, Pinecone, Weaviate, Qdrant, Meilisearch, pgvector.
Este não é um gig de criador de chatbot. Eu conserto a qualidade da recuperação para seu LLM parar de hallucinar.
Me envie uma mensagem com sua stack atual, tipo de dado e os problemas que está vendo antes de fazer o pedido.
Conheça mais sobre Said
Search and AI Architect specializing in Elasticsearch Solr RAG and Vector Search
- A partir deFrança
- Membro desdejun. de 2019
- Responde em aprox.:1 hora
- Última entrega5 anos
Idiomas
Francês, Árabe, Inglês
Tradução automática
Meu portfólio
Perguntas frequentes
Tradução automática
Com qual stack RAG você trabalha?
Qualquer. LangChain, LlamaIndex, pipelines personalizados. Armazenamentos de vetor: Elasticsearch, Pinecone, Weaviate, Qdrant, pgvector. Eu me adapto à sua stack.
Você vai construir um sistema RAG do zero?
Este gig é para auditar e otimizar pipelines existentes. Para novas construções, me envie uma mensagem para discutir o escopo separadamente.
Quais métricas você usa?
Precisão na recuperação, recall, NDCG, MRR e taxa de acerto. Eu faço medições antes e depois para que a melhora seja quantificada.
Você também ajusta os prompts do LLM?
Meu foco é na qualidade da recuperação. Uma recuperação melhor reduz hallucinações sem truques nos prompts. Mas posso aconselhar sobre a estrutura do prompt.

