🔍 RAG Pipeline

Documents → embeddings → vector DB → query → top-k search → LLM.

RAG = Retrieval Augmented Generation. Flow:

Documents— Your corpus (PDFs, docs, etc.)

↓

Embed— Convert chunks → vectors

↓

Vector DB— Store embeddings (e.g. Pinecone, Weaviate)

↓

Query— User question → query embedding

↓

Search— Find top-k closest vectors (ANN)

↓

LLM— Send query + retrieved chunks → generate answer