티스토리 뷰
RAG을 이용하여 Chatbot을 구현했습니다.
제가 진행했던 과정을 나열하겠습니다.
1. pdf 파일 : 낙상관련한 논문/글 9편 - data 폴더에 저장
2. file loading : pdf 파일을 loading 합니다.
3. text split : loading된 pdf 파일을 적당한 크기로 분리합니다.
4. DB 생성 : Vector DB를 생성합니다.
- Vector DB는 텍스트를 1차원의 배열로 만들어 그것을 DB로 만드는 과정입니다.
5. DB 저장 : 생성된 Vector DB를 로컬컴퓨터에 저장했습니다.
----------------------------------------------------------
6. 디스크에서 DB를 불러옵니다.
7. 검색기(Retriever)를 생성합니다.
8. 질문(Query)을 작성하고 검색(Retrieve)합니다.
9. 이때 질문과 답변을 언어모델에 의해 생성합니다.
10. 답변을 출력하여 보여줍니다.
-----------------------------------------------------------
사용된 모델과 프레임워크입니다.
1. 언어모델 : gpt-4o-mini (OpenAI)
2. 임베딩모델 : text-embedding-3-small
- 임베딩모델은 DB 생성할 때와 질문을 검색할 때 같은 모델을 사용해야 합니다.
- 임베딩 : 텍스트를 벡터(숫자)로 만드는 것이며 임베딩 모델이 다르면 벡터가 달라지므로 올바른 검색을 할 수 없습니다.
3. 챗 프레임워크 : streamlit
- 화면에서 입출력을 위한 툴입니다.
- Vector DB를 생성하는 과정 / 질문-검색-답변 과정 모두 streamlit에서 구현 가능합니다.
- 보여지는 화면은 '질문-검색-답변 과정'만 streamlit에서 구현한 것입니다.
4. gpt-4o-mini / text-embedding-3-small : 이 모델을 사용하면 비용이 발생합니다.
- 비용 : Vector DB 생성할 때 / 언어모델 gpt를 사용할 때 / 질문을 다시 Embedding 할 때
- 9개 문서 임베딩을 두 번 했고($0.01), gpt 사용($0.01) 정도가 과금되었습니다.
결과는 아래 첨부된 이미지에 있습니다.


'machineLearning > GPT' 카테고리의 다른 글
| Multi-Modal 이용하여 이미지 묘사 (0) | 2025.04.04 |
|---|---|
| RAG 구현하기 (0) | 2025.03.21 |
| RAG : VectorStore (0) | 2025.01.09 |
| chatGPT와 놀기_20241001 (5) | 2024.10.01 |
| 시 짓기 2 - GPT (1) | 2024.08.18 |
- Total
- Today
- Yesterday
- AI_고교수학
- 약수
- router chain
- LangChain
- 변화율
- 파이썬
- 미분계수
- streamlit
- checkpoint
- Chatbot
- 도함수
- 챗봇
- 프로그래머스
- 고등학교 수학
- 미분
- ChatGPT
- Python
- LLM
- 텐서플로우
- 감히 아름다움
- 랭체인
- TensorFlow
- prompt
- 미분법
- GPT
- programmers
- 로피탈정리
- programmers.co.kr
- RAG
- FewShot
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 |