#ai
7개 노트
Agentic RAG — Agent가 검색을 반복하고 판단하는 RAG
기존 RAG는 검색 1번 → 답변이지만, Agentic RAG는 Agent가 검색 결과를 보고 충분한지 판단한다. 부족하면 검색어를 바꾸거나 다른 도구로 재검색. ReAct 패턴(계획→실행→관찰→반복)으로 동작한다.
GraphRAG — 벡터 검색과 지식 그래프를 결합하는 RAG
벡터 검색은 '비슷한 것'만 찾지만 지식은 '연결된 것'도 중요하다. GraphRAG는 문서 간 관계를 그래프로 만들고, 벡터 검색 + 그래프 탐색을 합쳐서 관련 문서를 더 정확하게 찾는다.
Hybrid Search — 벡터 검색과 키워드 검색 결합
벡터 검색은 의미로, 키워드 검색은 정확한 단어로 찾는다. 둘 다 약점이 있어서 합치면 커버리지가 올라간다. RRF(Reciprocal Rank Fusion)로 두 결과의 순위를 합산해서 최종 순위를 매긴다.
MCP (Model Context Protocol) — Agent와 도구를 잇는 표준
MCP는 Agent와 도구 사이의 USB 같은 표준 규격이다. MCP Server가 도구를 감싸고, MCP를 지원하는 Agent(Host)면 어떤 도구든 연결 가능. Claude Code의 도구들(Read, Bash, Playwright 등)이 전부 MCP로 연결되어 있다.
RAG (Retrieval-Augmented Generation) — LLM에 외부 지식 주입 패턴
RAG는 LLM이 모르는 정보를 벡터 검색으로 찾아서 컨텍스트로 넘기는 구조다. 임베딩으로 텍스트를 벡터로 변환하고, 벡터 DB에서 유사도 검색 후 관련 문서만 LLM에 전달한다.
RAG 한계와 보완 전략 — 청킹·할루시네이션 대응
RAG는 할루시네이션을 줄이지만 없애지 못한다. 청킹 전략에 정답이 없고, 검색 실패 시 LLM이 지어내는 문제가 있다. Reranker, Hybrid Search, 출처 표시 등으로 보완한다.
Reranker — Cross-Encoder로 검색 결과 재평가
Bi-Encoder는 질문과 문서를 따로 임베딩해서 빠르지만 부정확할 수 있다. Cross-Encoder(Reranker)는 질문+문서를 한 번에 넣어서 관련성을 직접 평가한다. 느리지만 정확해서 1차 검색 후 2차 재평가로 쓴다.