RAG vs Open WebUI (Window)

Hướng dẫn thật chi tiết.


MỤC TIÊU

Cài đặt và chạy hệ thống RAG nội bộ trên Windows:

  • ✅ Sử dụng Docker Compose
  • ✅ Dùng Ollama với mô hình llama3:8b-instruct-q4_0
  • ✅ Giao diện thông qua Open WebUI
  • ✅ Dùng mô hình embedding tiếng Việt intfloat/multilingual-e5-small
  • ✅ Truy cập từ máy khác qua mạng LAN

BƯỚC 0: KIỂM TRA LẠI CẤU HÌNH MÁY

Thành phầnYêu cầu tối thiểu
Hệ điều hànhWindows 10 Pro 64-bit
CPUIntel i5 hoặc mạnh hơn
RAM≥ 16 GB
Ổ đĩa≥ 20 GB trống
InternetTạm thời cần tải mô hình (sau đó có thể chạy offline)

BƯỚC 1: CÀI ĐẶT PHẦN MỀM CẦN THIẾT

1.1. Cài Docker Desktop (có Docker Compose sẵn)

Truy cập trang tải:

👉 https://www.docker.com/products/docker-desktop/

Bấm [Download for Windows (x86_64)] → Cài đặt như phần mềm bình thường

Sau khi cài xong:

  • Mở Docker Desktop → đảm bảo nó đang chạy nền (icon con cá voi 🐳 dưới taskbar).
  • Mở CMD gõ kiểm tra:
docker --version
docker compose version

→ Nếu thấy hiện phiên bản là OK.

1.2. Cài Git (tuỳ chọn nhưng khuyến khích)

🔗 Tải tại: https://git-scm.com/download/win
→ Cài xong thì có thể dùng Git Bash (như terminal dễ dùng hơn CMD)


BƯỚC 2: TẠO THƯ MỤC LƯU HỆ THỐNG RAG

Cách 1: Dùng File Explorer

  1. Mở This PC → Vào ổ D: hoặc Desktop
  2. Tạo thư mục mới tên là: rag-system

Cách 2: Dùng CMD hoặc PowerShell

  1. Mở CMD hoặc PowerShell với quyền Admin:
    • Bấm Windows → Gõ cmd → click chuột phải → chọn Run as administrator
  2. Chạy lệnh:
mkdir C:\rag-system
cd C:\rag-system

BƯỚC 3: TẠO FILE docker-compose.yml

Cách 1: Dùng Notepad (đơn giản nhất)

  1. Mở Notepad → Dán nội dung dưới đây:
version: '3.8'

services:
  open-webui:
    image: ghcr.io/open-webui/open-webui:ollama
    container_name: open-webui
    ports:
      - "3000:8080"
    environment:
      - OLLAMA_BASE_URL=http://host.docker.internal:11434
      - EMBEDDING_MODEL=intfloat/multilingual-e5-small
    volumes:
      - open-webui-data:/app/backend/data
    restart: unless-stopped

volumes:
  open-webui-data:
  1. Lưu lại với tên chính xác là:
docker-compose.yml

→ Đặt trong thư mục C:\rag-system

📌 Cách lưu:

  • Trong Notepad → chọn File → Save As
  • Đặt tên: "docker-compose.yml" (nhớ dùng dấu " để không bị đổi thành .txt)
  • Save type: All Files → Encoding: UTF-8

BƯỚC 4: CÀI OLLAMA TRÊN WINDOWS

Vào: https://ollama.com/download

→ Tải bản Windows → Cài đặt như phần mềm bình thường.

Sau đó mở CMD kiểm tra:

ollama --version

Tải mô hình:

ollama pull llama3:8b-instruct-q4_0

→ Mô hình này sẽ mất ~4.5–5.0 GB dung lượng.


BƯỚC 5: KHỞI ĐỘNG HỆ THỐNG RAG BẰNG DOCKER COMPOSE

  1. Mở CMD hoặc PowerShell → Di chuyển vào thư mục:
cd C:\rag-system
  1. Chạy lệnh để khởi động:
docker compose up -d
  1. Mở trình duyệt và truy cập:
http://localhost:3000

→ Tạo tài khoản admin → cấu hình như sau:

  • Model: llama3:8b-instruct-q4_0
  • Embedding Model: intfloat/multilingual-e5-small

BƯỚC 6: CHO MÁY KHÁC TRUY CẬP TRONG MẠNG LAN

6.1. Xem địa chỉ IP máy bạn

Mở CMD → gõ:

ipconfig

→ Tìm dòng IPv4 Address, ví dụ: 192.168.1.50

6.2. Từ laptop khác → truy cập:

http://192.168.1.50:3000

📌 Nếu không truy cập được:

  • Mở Windows Defender Firewall → Cho phép Docker Desktop truy cập private network.
  • Tắt tường lửa thử nếu cần test nội bộ.

BẠN ĐÃ CÀI THÀNH CÔNG HỆ THỐNG RAG!

Thành phầnTrạng thái
Docker Desktop✅ Cài
Ollama + llama3✅ OK
WebUI qua Docker✅ Chạy ở cổng 3000
Embedding tiếng Việt✅ Đang dùng
Truy cập nội bộ✅ Có thể LAN

Viết một bình luận