개요
현재 재직 중인 회사는 다양한 계열사가 인수된 탓에 사용 중인 프로그램의 언어나 구조가 서로 상이하며, 문서 포맷도 통일되어 있지 않다. 그로 인해 업무 참고용 매뉴얼을 찾는 데에도 시간이 오래 걸리고,
찾더라도 파일 수가 많아 정리가 되어 있지 않아 원하는 정보를 찾기 어렵다는 문제가 발생하고 있다.
또한 ERP 고도화를 추진 중인데, 이 ERP는 외주 업체의 자체 Framework 기반으로 구성되어 있다 보니
내장 함수나 흐름에 대한 정보가 온라인 상에 존재하지 않아 검색이 불가능한 상황이다.
이러한 문제를 해결하기 위해, 사내 문서를 벡터화하여 검색하고 이를 기반으로 LLM이 답변을 생성하는 RAG 기반 문서 검색 시스템을 구축하고자 한다.
RAG란?
RAG(Retrieval-Augmented Generation)는 검색 기반 정보 검색과 생성형 AI를 결합한 기술이다.
요약하면 다음과 같다.
필요한 정보를 외부에서 검색해서, 그걸 기반으로 답변을 생성하는 방식
프로젝트 환경
이번 프로젝트는 다음과 같은 환경으로 구성되었다.
- 최근 관심을 가지고 있는 Cursor 기반 바이브코딩을 도입하고자 오픈소스 기반으로 구성
- 백엔드는 파이썬 기반으로 구성하여 AI 관련 기능을 유연하게 확장 가능하도록 설계
- 프론트엔드는 Next.js를 활용하여 사용자 친화적 인터페이스 제공
- 최초 셋팅은 Vooster.ai 를 통해 빠르게 기획 구조를 설계하고 마크다운 기반의 개발 문서 관리를 진행
- https://app.vooster.ai/ko/projects/prj_gk9e5pefpaawx34d3e42bf2v
다음 목표
현재는 구조 설계 및 프로젝트 틀을 세운 단계이며,
다음은 최초 환경설정 및 Vooster.ai 를 통해 등록된 태스크를 하나씩 진행하는 절차를 거치고자 한다.
참고 글
관련 용어 정리
용어설명
| RAG | Retrieval-Augmented Generation. 검색 기반 생성 AI 구조 |
| Embedding | 텍스트를 숫자 벡터로 변환하는 과정. 유사도 비교에 사용 |
| Vector DB | 임베딩된 벡터 데이터를 저장하고 유사한 벡터를 빠르게 찾을 수 있는 데이터베이스 |
| LLM | 대규모 언어 모델. GPT, Claude 등이 해당 |
'사이드 프로젝트' 카테고리의 다른 글
| RAG 기반 문서 검색 시스템 - 5(문서 업로드 및 S3 저장/바이러스 검사 구현) (2) | 2025.07.21 |
|---|---|
| RAG 기반 문서 검색 시스템 - 4(인증/권한/사용자/ORM 연동) (0) | 2025.07.21 |
| RAG 기반 문서 검색 시스템 - 3(Next.js 초기화 및 인증 연동) (2) | 2025.07.18 |
| RAG 기반 문서 검색 시스템 - 2 (AWS EKS 인프라 구축기) (2) | 2025.07.17 |
| RAG 기반 문서 검색 시스템 - 1(프로젝트 개발환경 구축) (1) | 2025.07.16 |