Agentic RAG 개념 정리
Agentic RAG란Agentic RAG는 검색(retrieval)을 고정된 단계로 실행하는 대신, 에이전트가 상황에 따라 검색 여부와 검색 방식을 스스로 결정하는 RAG 방식입니다. 기본 RAG는 보통 아래처럼 동작합니다. 사용자 질문 입력 검색 시스템에서 관련 문서 조회 검색 결과를 LLM에 넣어 답변 생성 즉, 검색은 항상 먼저 일어나고, 생성
Agentic RAG란Agentic RAG는 검색(retrieval)을 고정된 단계로 실행하는 대신, 에이전트가 상황에 따라 검색 여부와 검색 방식을 스스로 결정하는 RAG 방식입니다. 기본 RAG는 보통 아래처럼 동작합니다. 사용자 질문 입력 검색 시스템에서 관련 문서 조회 검색 결과를 LLM에 넣어 답변 생성 즉, 검색은 항상 먼저 일어나고, 생성
Corrective RAG란Corrective RAG(CRAG)는 기존 RAG 파이프라인에 “검색 결과 검증 및 보정 단계”를 추가한 방식입니다. 일반적인 RAG는 아래 흐름으로 동작합니다. 사용자 질문 입력 벡터 DB 또는 검색 시스템에서 관련 문서 검색 검색된 문서를 컨텍스트로 LLM이 답변 생성 문제는 검색 결과가 부정확하거나, 애매하거나, 일부
RAG 시스템 최적화 개요RAG 시스템의 성능은 다음 세 가지 측면에서 최적화할 수 있습니다: 검색 품질 - 관련성 높은 문서 찾기 응답 품질 - 정확하고 유용한 답변 생성 성능/비용 - 빠른 응답과 비용 효율성 1. 청킹 전략 최적화1.1 고정 크기 청킹from langchain.text_splitter import RecursiveChar
벡터 데이터베이스란?벡터 데이터베이스는 고차원 벡터 데이터를 효율적으로 저장하고 검색하는 데 특화된 데이터베이스입니다. RAG 시스템의 핵심 구성 요소입니다. 주요 벡터 데이터베이스 비교1. ChromaDB특징: 오픈소스, 로컬 우선 설계 Python 친화적 가볍고 시작하기 쉬움 임베디드 모드 지원 장점: ✅ 설치 및 설정이 매우 간단 ✅ 로컬 개발
RAG 시스템 구축 단계RAG 시스템을 처음부터 구축하는 전체 과정을 단계별로 설명합니다. 1. 환경 설정필수 라이브러리 설치# Python 가상환경 생성python -m venv venvsource venv/bin/activate # Windows: venv\Scripts\activate# 기본 라이브러리 설치pip install langchain l
RAG란?RAG(Retrieval-Augmented Generation)는 대규모 언어 모델(LLM)의 응답을 개선하기 위해 외부 지식 베이스에서 관련 정보를 검색하여 활용하는 기술입니다. RAG의 필요성 지식 최신성 문제 해결 LLM은 학습 시점까지의 데이터만 알고 있음 최신 정보나 실시간 데이터 제공 불가 RAG를 통해 최신 문서/데이터 참