Vou construir um chatbot de produção com rag sobre seus documentos

W
waqarshad897
W
waqarshad897
Waqar Makki
Algumas informações foram traduzidas automaticamente.

Sobre este Serviço

Tradução automática

Quase todos os chatbots RAG falham na produção porque param no chunk e embed. Isso funciona com 5 documentos. Quebra com 500, em PDFs multi-página, e em qualquer questão mais nuanceada.


Sou um engenheiro de IA para produção baseado em Lahore. Já implementei RAG no AWS Bedrock (Llama 3 70B) para matching de talentos, e em stacks OpenAI/Pinecone para suporte ao cliente. Meus sistemas são avaliados, não só na base da vibe.


O que você vai receber:

Chunking inteligente ajustado à estrutura do seu documento, não divisões genéricas de 512 tokens

Pesquisa híbrida (semântica + BM25 por palavra-chave) para que termos exatos ainda sejam encontrados

Embeddings ricos em metadados + índices hierárquicos para grandes coleções de documentos

Relatório de avaliação RAGAS: Fidelidade, Relevância da resposta, Precisão do contexto e Recall

Citações de fontes em cada resposta, sem alucinações passadas como fatos

Demo implantada, código fonte, README, suporte por 14 dias após a entrega


Stacks: AWS Bedrock (Llama 3, Claude), OpenAI, Anthropic, PGVector, Pinecone, ChromaDB, LangChain, LangGraph, FastAPI, Streamlit. Vou recomendar o que cabe no seu orçamento e no volume de dados.


Me envie uma mensagem com um documento de exemplo e 5 perguntas esperadas, e te direi honestamente se é uma boa combinação.

Conheça mais sobre Waqar Makki

Waqar Makki

GenAI Specialist: LLMs, NLP, Computer Vision Expert

4,8(27)
  • A partir dePaquistão
  • Membro desdejul. de 2019
  • Última entrega1 ano
  • Idiomas

    Urdu, Inglês
I am a GenAI-focused Data Scientist & ML Engineer with over 4 years of experience specializing in production-grade NLP, GenAI, and Computer Vision applications. I translate complex R&D into high-impact commercial solutions. Expertise: - LLMs & RAG: Architecting AWS pipelines (Bedrock, PGVector) that reduced latency by 30%. - Computer Vision: Expert in YOLOv8 and high-precision medical image segmentation. - Agentic Workflows: Engineering autonomous AI ecosystems and REST APIs for rapid response. I build scalable, optimized AI systems that deliver measurable results. Let’s collaborate!

Tradução automática