RAG(Retrieval-Augmented Generation) 란 무엇일까?

개요

RAG는 Retrieval-Augmented Generation의 약자로, 검색 기반 정보 검색과 생성형 AI를 결합한 기술이다. 간단히 말하면, 필요한 정보를 외부에서 검색해서 그것을 기반으로 답변을 생성하는 방식이다.

"필요한 정보를 외부에서 검색하고, 그 결과를 기반으로 LLM이 응답을 생성하는 구조"

RAG는 크게 두 단계로 구성된다.

예: "알베르 카뮈의 대표작은?" → 관련 책 정보를 DB에서 찾아옴

GPT 같은 LLM은 학습된 데이터에만 기반하여 답변하기 때문에 다음과 같은 한계가 있다.

이러한 한계를 보완하기 위해 RAG를 도입하면, 사내 문서, PDF, DB 등에서 컨텍스트를 동적으로 검색하고 이를 기반으로 보다 정확한 최신 답변을 생성할 수 있게 된다.

단계	역할	사용 기술 예시
데이터 수집	텍스트 문서, PDF, 위키 등 수집	크롤러, API, 수동 업로드
임베딩	텍스트를 벡터로 변환	OpenAI Embedding, HuggingFace 등
벡터 저장소	유사도 기반 검색	FAISS, Weaviate, Pinecone, Qdrant
검색	사용자 질문과 유사한 문서 검색	Cosine Similarity 등
생성	검색된 문서 기반으로 답변 생성	GPT-4, Claude 등

용어	설명
RAG	Retrieval-Augmented Generation. 검색된 정보를 기반으로 AI가 답변을 생성하는 방식
LLM	Large Language Model. GPT, Claude 등 대규모 언어 모델
벡터 DB	문서를 숫자 벡터로 저장하여 유사한 내용을 빠르게 검색하는 데이터베이스
임베딩	문장이나 단어를 AI가 이해할 수 있는 숫자 벡터로 변환하는 과정
컨텍스트	AI가 답변할 때 참고하는 문서나 정보
FAISS, Weaviate, Pinecone, Qdrant	벡터 DB 구축에 사용되는 솔루션
GPT, Claude	대표적인 생성형 언어 모델
IR 보고서	기업의 실적과 전략이 담긴 Investor Relations 문서

RAG는 사내 문서나 최신 데이터를 활용해 LLM 기반 시스템의 정확도를 극대화할 수 있는 대표적인 구조다. 검색과 생성의 조합은 단순 질의응답을 넘어, 실제 업무 자동화 및 지식 검색 시스템 구축에 핵심이 된다.