티스토리 뷰

machineLearning/GPT

Chatbot으로 RAG 구현

이나기꺼 2025. 1. 22. 11:09

RAG을 이용하여 Chatbot을 구현했습니다.

제가 진행했던 과정을 나열하겠습니다.

1. pdf 파일 : 낙상관련한 논문/글 9편 - data 폴더에 저장
2. file loading : pdf 파일을 loading 합니다.
3. text split : loading된 pdf 파일을 적당한 크기로 분리합니다.
4. DB 생성 : Vector DB를 생성합니다.
  - Vector DB는 텍스트를 1차원의 배열로 만들어 그것을 DB로 만드는 과정입니다.
5. DB 저장 : 생성된 Vector DB를 로컬컴퓨터에 저장했습니다.
----------------------------------------------------------
6. 디스크에서 DB를 불러옵니다.
7. 검색기(Retriever)를 생성합니다.
8. 질문(Query)을 작성하고 검색(Retrieve)합니다.
9. 이때 질문과 답변을 언어모델에 의해 생성합니다.
10. 답변을 출력하여 보여줍니다.
 
 
-----------------------------------------------------------


사용된 모델과 프레임워크입니다.
1. 언어모델 : gpt-4o-mini (OpenAI)
2. 임베딩모델 : text-embedding-3-small
  - 임베딩모델은 DB 생성할 때와 질문을 검색할 때 같은 모델을 사용해야 합니다.
  - 임베딩 : 텍스트를 벡터(숫자)로 만드는 것이며 임베딩 모델이 다르면 벡터가 달라지므로 올바른 검색을 할 수 없습니다.
3. 챗 프레임워크 : streamlit
  - 화면에서 입출력을 위한 툴입니다.
  - Vector DB를 생성하는 과정 / 질문-검색-답변 과정 모두 streamlit에서 구현 가능합니다.
  - 보여지는 화면은 '질문-검색-답변 과정'만 streamlit에서 구현한 것입니다.
4. gpt-4o-mini / text-embedding-3-small : 이 모델을 사용하면 비용이 발생합니다.
  - 비용 : Vector DB 생성할 때 / 언어모델 gpt를 사용할 때 / 질문을 다시 Embedding 할 때
  - 9개 문서 임베딩을 두 번 했고($0.01), gpt 사용($0.01) 정도가 과금되었습니다.

결과는 아래 첨부된 이미지에 있습니다.

 

 

'machineLearning > GPT' 카테고리의 다른 글

Multi-Modal 이용하여 이미지 묘사  (0) 2025.04.04
RAG 구현하기  (0) 2025.03.21
RAG : VectorStore  (0) 2025.01.09
chatGPT와 놀기_20241001  (5) 2024.10.01
시 짓기 2 - GPT  (1) 2024.08.18
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/12   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31
글 보관함