RAG 기반 문서 검색 시스템(개요 및 프로젝트 설계)

2025. 7. 15. 15:47·사이드 프로젝트

개요

현재 재직 중인 회사는 다양한 계열사가 인수된 탓에 사용 중인 프로그램의 언어나 구조가 서로 상이하며, 문서 포맷도 통일되어 있지 않다. 그로 인해 업무 참고용 매뉴얼을 찾는 데에도 시간이 오래 걸리고,
찾더라도 파일 수가 많아 정리가 되어 있지 않아 원하는 정보를 찾기 어렵다는 문제가 발생하고 있다.

또한 ERP 고도화를 추진 중인데, 이 ERP는 외주 업체의 자체 Framework 기반으로 구성되어 있다 보니
내장 함수나 흐름에 대한 정보가 온라인 상에 존재하지 않아 검색이 불가능한 상황이다.

이러한 문제를 해결하기 위해, 사내 문서를 벡터화하여 검색하고 이를 기반으로 LLM이 답변을 생성하는 RAG 기반 문서 검색 시스템을 구축하고자 한다.


RAG란?

RAG(Retrieval-Augmented Generation)는 검색 기반 정보 검색과 생성형 AI를 결합한 기술이다.
요약하면 다음과 같다.

필요한 정보를 외부에서 검색해서, 그걸 기반으로 답변을 생성하는 방식


프로젝트 환경

이번 프로젝트는 다음과 같은 환경으로 구성되었다.

  • 최근 관심을 가지고 있는 Cursor 기반 바이브코딩을 도입하고자 오픈소스 기반으로 구성
  • 백엔드는 파이썬 기반으로 구성하여 AI 관련 기능을 유연하게 확장 가능하도록 설계
  • 프론트엔드는 Next.js를 활용하여 사용자 친화적 인터페이스 제공
  • 최초 셋팅은 Vooster.ai 를 통해 빠르게 기획 구조를 설계하고 마크다운 기반의 개발 문서 관리를 진행
  • https://app.vooster.ai/ko/projects/prj_gk9e5pefpaawx34d3e42bf2v

다음 목표

현재는 구조 설계 및 프로젝트 틀을 세운 단계이며,
다음은 최초 환경설정 및 Vooster.ai 를 통해 등록된 태스크를 하나씩 진행하는 절차를 거치고자 한다.


참고 글

  • RAG(Retrieval-Augmented Generation) 란 무엇일까?

관련 용어 정리

용어설명
RAG Retrieval-Augmented Generation. 검색 기반 생성 AI 구조
Embedding 텍스트를 숫자 벡터로 변환하는 과정. 유사도 비교에 사용
Vector DB 임베딩된 벡터 데이터를 저장하고 유사한 벡터를 빠르게 찾을 수 있는 데이터베이스
LLM 대규모 언어 모델. GPT, Claude 등이 해당

 

'사이드 프로젝트' 카테고리의 다른 글

RAG 기반 문서 검색 시스템 - 5(문서 업로드 및 S3 저장/바이러스 검사 구현)  (2) 2025.07.21
RAG 기반 문서 검색 시스템 - 4(인증/권한/사용자/ORM 연동)  (0) 2025.07.21
RAG 기반 문서 검색 시스템 - 3(Next.js 초기화 및 인증 연동)  (2) 2025.07.18
RAG 기반 문서 검색 시스템 - 2 (AWS EKS 인프라 구축기)  (2) 2025.07.17
RAG 기반 문서 검색 시스템 - 1(프로젝트 개발환경 구축)  (1) 2025.07.16
'사이드 프로젝트' 카테고리의 다른 글
  • RAG 기반 문서 검색 시스템 - 4(인증/권한/사용자/ORM 연동)
  • RAG 기반 문서 검색 시스템 - 3(Next.js 초기화 및 인증 연동)
  • RAG 기반 문서 검색 시스템 - 2 (AWS EKS 인프라 구축기)
  • RAG 기반 문서 검색 시스템 - 1(프로젝트 개발환경 구축)
moo-n
moo-n
개발관련 기록 블로그
  • moo-n
    moo-n 님의 블로그
    moo-n
  • 전체
    오늘
    어제
    • 분류 전체보기 (48)
      • Cursor AI 교육관련 (4)
      • Cursor AI 사용하기(JAVA) (3)
      • Cursor AI 사용하기(C#) (1)
      • MCP 사용하기 (2)
      • IT 관련 정리 (15)
      • 사이드 프로젝트 (15)
      • 장애대응 매뉴얼 (3)
      • 업무관련 (4)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    nextjs
    notion
    Chunk
    mcp
    LLM
    SVN
    포트포워딩
    Cursor
    청킹
    notion mcp
    Rag
    oracleClient
    conTeXt
    AI
    방화벽
    벡터db
    Agent
    임베딩
    Chunking
    C#
    OCR
    claude code
    에이전트
    ClaudeCode
    바이브코딩
    vb6.0
    Claude
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.4
moo-n
RAG 기반 문서 검색 시스템(개요 및 프로젝트 설계)
상단으로

티스토리툴바