Hướng dẫn thật chi tiết.
MỤC TIÊU
Cài đặt và chạy hệ thống RAG nội bộ trên Windows:
- ✅ Sử dụng Docker Compose
- ✅ Dùng Ollama với mô hình
llama3:8b-instruct-q4_0
- ✅ Giao diện thông qua Open WebUI
- ✅ Dùng mô hình embedding tiếng Việt
intfloat/multilingual-e5-small
- ✅ Truy cập từ máy khác qua mạng LAN
BƯỚC 0: KIỂM TRA LẠI CẤU HÌNH MÁY
Thành phần | Yêu cầu tối thiểu |
---|---|
Hệ điều hành | Windows 10 Pro 64-bit |
CPU | Intel i5 hoặc mạnh hơn |
RAM | ≥ 16 GB |
Ổ đĩa | ≥ 20 GB trống |
Internet | Tạm thời cần tải mô hình (sau đó có thể chạy offline) |
BƯỚC 1: CÀI ĐẶT PHẦN MỀM CẦN THIẾT
1.1. Cài Docker Desktop (có Docker Compose sẵn)
Truy cập trang tải:
👉 https://www.docker.com/products/docker-desktop/
Bấm [Download for Windows (x86_64)] → Cài đặt như phần mềm bình thường
Sau khi cài xong:
- Mở Docker Desktop → đảm bảo nó đang chạy nền (icon con cá voi 🐳 dưới taskbar).
- Mở CMD gõ kiểm tra:
docker --version
docker compose version
→ Nếu thấy hiện phiên bản là OK.
1.2. Cài Git (tuỳ chọn nhưng khuyến khích)
🔗 Tải tại: https://git-scm.com/download/win
→ Cài xong thì có thể dùng Git Bash (như terminal dễ dùng hơn CMD)
BƯỚC 2: TẠO THƯ MỤC LƯU HỆ THỐNG RAG
Cách 1: Dùng File Explorer
- Mở This PC → Vào ổ D: hoặc Desktop
- Tạo thư mục mới tên là:
rag-system
Cách 2: Dùng CMD hoặc PowerShell
- Mở CMD hoặc PowerShell với quyền Admin:
- Bấm Windows → Gõ
cmd
→ click chuột phải → chọn Run as administrator
- Bấm Windows → Gõ
- Chạy lệnh:
mkdir C:\rag-system
cd C:\rag-system
BƯỚC 3: TẠO FILE docker-compose.yml
Cách 1: Dùng Notepad (đơn giản nhất)
- Mở Notepad → Dán nội dung dưới đây:
version: '3.8'
services:
open-webui:
image: ghcr.io/open-webui/open-webui:ollama
container_name: open-webui
ports:
- "3000:8080"
environment:
- OLLAMA_BASE_URL=http://host.docker.internal:11434
- EMBEDDING_MODEL=intfloat/multilingual-e5-small
volumes:
- open-webui-data:/app/backend/data
restart: unless-stopped
volumes:
open-webui-data:
- Lưu lại với tên chính xác là:
docker-compose.yml
→ Đặt trong thư mục C:\rag-system
📌 Cách lưu:
- Trong Notepad → chọn File → Save As
- Đặt tên:
"docker-compose.yml"
(nhớ dùng dấu"
để không bị đổi thành.txt
) - Save type: All Files → Encoding: UTF-8
BƯỚC 4: CÀI OLLAMA TRÊN WINDOWS
Vào: https://ollama.com/download
→ Tải bản Windows → Cài đặt như phần mềm bình thường.
Sau đó mở CMD kiểm tra:
ollama --version
Tải mô hình:
ollama pull llama3:8b-instruct-q4_0
→ Mô hình này sẽ mất ~4.5–5.0 GB dung lượng.
BƯỚC 5: KHỞI ĐỘNG HỆ THỐNG RAG BẰNG DOCKER COMPOSE
- Mở CMD hoặc PowerShell → Di chuyển vào thư mục:
cd C:\rag-system
- Chạy lệnh để khởi động:
docker compose up -d
- Mở trình duyệt và truy cập:
http://localhost:3000
→ Tạo tài khoản admin → cấu hình như sau:
- Model:
llama3:8b-instruct-q4_0
- Embedding Model:
intfloat/multilingual-e5-small
BƯỚC 6: CHO MÁY KHÁC TRUY CẬP TRONG MẠNG LAN
6.1. Xem địa chỉ IP máy bạn
Mở CMD → gõ:
ipconfig
→ Tìm dòng IPv4 Address
, ví dụ: 192.168.1.50
6.2. Từ laptop khác → truy cập:
http://192.168.1.50:3000
📌 Nếu không truy cập được:
- Mở Windows Defender Firewall → Cho phép Docker Desktop truy cập private network.
- Tắt tường lửa thử nếu cần test nội bộ.
BẠN ĐÃ CÀI THÀNH CÔNG HỆ THỐNG RAG!
Thành phần | Trạng thái |
---|---|
Docker Desktop | ✅ Cài |
Ollama + llama3 | ✅ OK |
WebUI qua Docker | ✅ Chạy ở cổng 3000 |
Embedding tiếng Việt | ✅ Đang dùng |
Truy cập nội bộ | ✅ Có thể LAN |