Category: AI

0

Agentic RAG 개념 정리

Agentic RAG란Agentic RAG는 검색(retrieval)을 고정된 단계로 실행하는 대신, 에이전트가 상황에 따라 검색 여부와 검색 방식을 스스로 결정하는 RAG 방식입니다. 기본 RAG는 보통 아래처럼 동작합니다. 사용자 질문 입력 검색 시스템에서 관련 문서 조회 검색 결과를 LLM에 넣어 답변 생성 즉, 검색은 항상 먼저 일어나고, 생성

0

Corrective RAG (CRAG) 개념 정리

Corrective RAG란Corrective RAG(CRAG)는 기존 RAG 파이프라인에 “검색 결과 검증 및 보정 단계”를 추가한 방식입니다. 일반적인 RAG는 아래 흐름으로 동작합니다. 사용자 질문 입력 벡터 DB 또는 검색 시스템에서 관련 문서 검색 검색된 문서를 컨텍스트로 LLM이 답변 생성 문제는 검색 결과가 부정확하거나, 애매하거나, 일부

0

Hugging Face 완벽 가이드 - Transformers, Datasets, Hub 활용법

Hugging Face란?Hugging Face는 자연어 처리(NLP)와 머신러닝을 위한 오픈소스 플랫폼입니다. 2016년 설립된 이후 AI 커뮤니티의 중심이 되어, 사전 학습된 모델, 데이터셋, 도구를 공유하고 협업할 수 있는 생태계를 만들었습니다. Hugging Face의 핵심 구성 요소 Transformers: 사전 학습된 모델을 쉽게 사용할 수 있

0

LangGraph 완벽 가이드 - AI 에이전트와 워크플로우 구축

LangGraph란?LangGraph는 LangChain을 기반으로 상태를 가진(stateful) 멀티 액터 애플리케이션을 그래프로 구축할 수 있는 라이브러리입니다. LangChain이 단순한 체인 구조라면, LangGraph는 복잡한 순환 구조와 조건부 분기를 지원하는 강력한 워크플로우 엔진입니다. LangGraph의 탄생 배경LangChain의 체인

0

LangChain과 LangGraph로 시작하는 AI 에이전트 개발

LangChain과 LangGraph 개요LangChain과 LangGraph는 대규모 언어 모델(LLM)을 활용한 애플리케이션 개발을 위한 강력한 프레임워크입니다. LangChain은 LLM 기반 애플리케이션 개발을 위한 기본 구성 요소를 제공하며, LangGraph는 복잡한 AI 에이전트와 워크플로우를 그래프 구조로 설계할 수 있게 해줍니다. Lang

0

LangChain 완벽 가이드 - LLM 애플리케이션 개발의 시작

LangChain이란?LangChain은 대규모 언어 모델(LLM)을 활용한 애플리케이션을 쉽게 구축할 수 있도록 돕는 오픈소스 프레임워크입니다. 2022년 10월 Harrison Chase가 시작한 프로젝트로, LLM 기반 애플리케이션 개발의 사실상 표준이 되었습니다. LangChain의 주요 특징 체인(Chain) 기반 구조: 여러 컴포넌트를 연결하여

0

Google Gemini 2.5 Flash 사용 가이드

1. API 키 발급Google AI Studio에서 API 키 받기 Google AI Studio 접속 Google 계정으로 로그인 “Get API Key” 또는 “API 키 만들기” 클릭 새 프로젝트 생성 또는 기존 프로젝트 선택 API 키 복사 및 안전하게 보관 환경 변수 설정# Linux/macOSexport GOOGLE_API_KEY='

0

Ollama를 이용한 GPT OSS 20B 모델 설치 가이드

Ollama를 이용한 GPT OSS 20B 모델 설치 가이드Ollama를 사용하여 오픈소스 GPT 대규모 언어 모델을 로컬 환경에서 실행하는 방법을 안내합니다. 1. Ollama 설치macOS/Linuxcurl -fsSL https://ollama.com/install.sh | sh WindowsOllama 공식 웹사이트에서 Windows 설치

0

RAG 성능 최적화 기법

RAG 시스템 최적화 개요RAG 시스템의 성능은 다음 세 가지 측면에서 최적화할 수 있습니다: 검색 품질 - 관련성 높은 문서 찾기 응답 품질 - 정확하고 유용한 답변 생성 성능/비용 - 빠른 응답과 비용 효율성 1. 청킹 전략 최적화1.1 고정 크기 청킹from langchain.text_splitter import RecursiveChar

0

벡터 데이터베이스 비교 및 선택 가이드

벡터 데이터베이스란?벡터 데이터베이스는 고차원 벡터 데이터를 효율적으로 저장하고 검색하는 데 특화된 데이터베이스입니다. RAG 시스템의 핵심 구성 요소입니다. 주요 벡터 데이터베이스 비교1. ChromaDB특징: 오픈소스, 로컬 우선 설계 Python 친화적 가볍고 시작하기 쉬움 임베디드 모드 지원 장점: ✅ 설치 및 설정이 매우 간단 ✅ 로컬 개발

0

RAG 시스템 구축 가이드

RAG 시스템 구축 단계RAG 시스템을 처음부터 구축하는 전체 과정을 단계별로 설명합니다. 1. 환경 설정필수 라이브러리 설치# Python 가상환경 생성python -m venv venvsource venv/bin/activate # Windows: venv\Scripts\activate# 기본 라이브러리 설치pip install langchain l

0

RAG (Retrieval-Augmented Generation) 개요

RAG란?RAG(Retrieval-Augmented Generation)는 대규모 언어 모델(LLM)의 응답을 개선하기 위해 외부 지식 베이스에서 관련 정보를 검색하여 활용하는 기술입니다. RAG의 필요성 지식 최신성 문제 해결 LLM은 학습 시점까지의 데이터만 알고 있음 최신 정보나 실시간 데이터 제공 불가 RAG를 통해 최신 문서/데이터 참