RAG (Retrieval-Augmented Generation) 개요

AI, LLM, NLP, RAG

RAG란?

RAG(Retrieval-Augmented Generation)는 대규모 언어 모델(LLM)의 응답을 개선하기 위해 외부 지식 베이스에서 관련 정보를 검색하여 활용하는 기술입니다.

지식 최신성 문제 해결
- LLM은 학습 시점까지의 데이터만 알고 있음
- 최신 정보나 실시간 데이터 제공 불가
- RAG를 통해 최신 문서/데이터 참조 가능
환각(Hallucination) 감소
- LLM이 사실이 아닌 내용을 생성하는 문제
- 외부 신뢰할 수 있는 소스 참조로 정확성 향상
도메인 특화 지식 제공
- 기업 내부 문서, 특정 도메인 지식 활용
- 재학습 없이 특정 분야 전문성 확보
비용 효율성
- 모델 재학습(Fine-tuning) 대비 저렴
- 데이터 업데이트가 용이

사용자 질문
    ↓
1. 질문 임베딩 생성
    ↓
2. 벡터 DB에서 유사 문서 검색
    ↓
3. 검색된 문서 + 질문을 LLM에 입력
    ↓
4. LLM이 컨텍스트 기반 답변 생성
    ↓
최종 답변 제공

문서 처리 (Document Processing)
- 문서 수집 및 전처리
- 청크 분할 (Chunking)
- 임베딩 생성
검색 시스템 (Retrieval System)
- 벡터 데이터베이스
- 유사도 검색 알고리즘
- 하이브리드 검색 (키워드 + 벡터)
생성 모델 (Generation Model)
- LLM (GPT, Claude, Llama 등)
- 프롬프트 엔지니어링
- 컨텍스트 윈도우 관리