← Notes
#embedding
4개 노트
RT
ai/rag/retrieval 2026-04-07
Hybrid Search — 벡터 검색과 키워드 검색 결합
벡터 검색은 의미로, 키워드 검색은 정확한 단어로 찾는다. 둘 다 약점이 있어서 합치면 커버리지가 올라간다. RRF(Reciprocal Rank Fusion)로 두 결과의 순위를 합산해서 최종 순위를 매긴다.
ragaiembeddingsearch
RG
ai/rag 2026-04-07
RAG (Retrieval-Augmented Generation) — LLM에 외부 지식 주입 패턴
RAG는 LLM이 모르는 정보를 벡터 검색으로 찾아서 컨텍스트로 넘기는 구조다. 임베딩으로 텍스트를 벡터로 변환하고, 벡터 DB에서 유사도 검색 후 관련 문서만 LLM에 전달한다.
ragllmaiembeddingvector-db
RG
ai/rag 2026-04-07
RAG 한계와 보완 전략 — 청킹·할루시네이션 대응
RAG는 할루시네이션을 줄이지만 없애지 못한다. 청킹 전략에 정답이 없고, 검색 실패 시 LLM이 지어내는 문제가 있다. Reranker, Hybrid Search, 출처 표시 등으로 보완한다.
ragllmaiembeddinghallucination
RT
ai/rag/retrieval 2026-04-07
Reranker — Cross-Encoder로 검색 결과 재평가
Bi-Encoder는 질문과 문서를 따로 임베딩해서 빠르지만 부정확할 수 있다. Cross-Encoder(Reranker)는 질문+문서를 한 번에 넣어서 관련성을 직접 평가한다. 느리지만 정확해서 1차 검색 후 2차 재평가로 쓴다.
ragaiembeddingsearchreranker