
OpenClaw + CLIProxyAPI + ProxyPal: Dùng Nhiều AI Provider, Không Lo Token Limit
Hướng dẫn cài đặt và cấu hình OpenClaw kết hợp CLIProxyAPI và ProxyPal để sử dụng Claude, GPT-4o, Gemini, Qwen cùng lúc — load balancing, auto failover và monitor token usage qua GUI desktop tiện lợi.
Một trong những điểm đau lớn nhất khi dùng AI agent cho công việc hàng ngày là token limit — đang giữa chừng task thì Claude hoặc GPT-4o báo "rate limit exceeded" và phải chờ. Giải pháp: kết hợp CLIProxyAPI + ProxyPal với OpenClaw để chạy nhiều provider song song, tự động failover khi hết quota.

OpenClaw → CLIProxyAPI → Claude / GPT-4o / Gemini / DeepSeek / Qwen — tự động chuyển provider khi hết quota
3 Thành Phần Trong Stack
1. OpenClaw 🦞
AI personal agent local-first — chạy task, kết nối Telegram/Discord, quản lý file, duyệt web. Đọc bài setup OpenClaw nếu chưa cài.
2. CLIProxyAPI
Proxy server wrap các CLI AI model (Claude Code, Gemini CLI, OpenAI Codex, Qwen Code) thành API endpoint tương thích OpenAI/Gemini/Claude. Không cần API key riêng — dùng thẳng subscription đang có.
Tính năng chính:
- Wrap CLI agents → chuẩn OpenAI API format
- Round-robin load balancing nhiều account
- Auto failover khi một provider bị rate limit
- Hỗ trợ OAuth (không cần expose API key)
3. ProxyPal
Desktop GUI quản lý CLIProxyAPI — giao diện desktop để thêm provider, xem token usage, monitor request logs mà không cần chạm đến CLI.
Tính năng:
- Quản lý subscriptions: Claude, ChatGPT, Gemini, GitHub Copilot
- GitHub Copilot Bridge
- Antigravity Support
- Usage analytics + token monitoring real-time
- Tự động detect và config CLI agents đã cài
Cách Hoạt Động
Bạn nhắn Telegram → OpenClaw nhận → gửi request → CLIProxyAPI
│
┌─────────────────────────┤
▼ ▼
Claude Code CLI GPT-4o CLI
(primary) (fallback 1)
│ rate limited?
▼
Gemini CLI Qwen Code CLI
(fallback 2) (fallback 3)
CLIProxyAPI xử lý logic:
- Gửi request đến primary provider (Claude)
- Nếu bị rate limit → cooldown 1 phút → 5 phút → 25 phút → 1 giờ
- Tự động chuyển sang fallback tiếp theo trong danh sách
- Nếu billing issue → backoff 5 giờ, tăng dần đến 24 giờ
- OpenClaw nhận kết quả — không biết provider nào đã xử lý
Cài Đặt
Bước 1: Cài CLIProxyAPI
npm install -g cliproxyapi@latest
# hoặc:
pnpm add -g cliproxyapi@latest
Bước 2: Cài CLI Agents Cần Dùng
Cài các CLI agent bạn có subscription:
# Claude Code
npm install -g @anthropic-ai/claude-code
# Gemini CLI (Google)
npm install -g @google/gemini-cli
# OpenAI Codex CLI
npm install -g @openai/codex
Bước 3: Cài ProxyPal (GUI Desktop)
Tải ProxyPal từ proxypal.app — có bản cho macOS, Windows và Linux.
Sau khi mở ProxyPal:
- Nó tự detect các CLI agents đã cài
- Thêm subscription credentials
- Bật toggle cho từng provider muốn dùng
Bước 4: Khởi Chạy CLIProxyAPI Server
# Chạy server (mặc định port 4141):
cliproxyapi start --port 4141
# Hoặc để chạy nền:
cliproxyapi start --port 4141 --daemon
Kiểm tra server đang chạy:
curl http://localhost:4141/v1/models
Cấu Hình OpenClaw Kết Nối CLIProxyAPI
Chỉnh ~/.openclaw/openclaw.json:
{
"agent": {
"model": "anthropic/claude-opus-4-6",
"model": {
"primary": "anthropic/claude-opus-4-6",
"fallbacks": [
"openai/gpt-4o",
"google-antigravity/gemini-2.5-pro",
"openai/gpt-4o-mini"
]
}
},
"providers": {
"anthropic": {
"baseUrl": "http://localhost:4141/anthropic"
},
"openai": {
"baseUrl": "http://localhost:4141/openai"
},
"google-antigravity": {
"baseUrl": "http://localhost:4141/gemini"
}
}
}
Giải thích:
primary→ model được dùng đầu tiênfallbacks→ danh sách provider dự phòng theo thứ tự ưu tiênbaseUrl→ trỏ về CLIProxyAPI thay vì API cloud trực tiếp
Cấu Hình Failover Nâng Cao
Điều Chỉnh Cooldown
{
"auth": {
"cooldowns": {
"billingBackoffHours": 5,
"billingMaxHours": 24,
"failureWindowHours": 24
}
}
}
| Key | Mặc định | Ý nghĩa |
|---|---|---|
billingBackoffHours | 5h | Thời gian chờ đầu tiên khi billing issue |
billingMaxHours | 24h | Thời gian chờ tối đa |
failureWindowHours | 24h | Reset error counter nếu không fail trong khoảng này |
Multi-Account Cho Cùng Một Provider
Nếu bạn có 2 account Claude, CLIProxyAPI round-robin giữa chúng:
File auth-profiles.json (~/.openclaw/agents/<agentId>/agent/auth-profiles.json):
{
"profiles": {
"anthropic:account1@gmail.com": {
"type": "oauth",
"provider": "anthropic",
"email": "account1@gmail.com"
},
"anthropic:account2@gmail.com": {
"type": "oauth",
"provider": "anthropic",
"email": "account2@gmail.com"
}
}
}
OpenClaw sẽ:
- Dùng
account1trước (oldest last used first) - Khi account1 bị rate limit → cooldown → chuyển sang
account2 - Khi cả 2 bị rate limit → chuyển sang model fallback tiếp theo
Monitor Qua ProxyPal GUI
Sau khi setup xong, mở ProxyPal để xem:
- Dashboard: request count / token usage real-time
- Provider Status: màu xanh (active), vàng (cooldown), đỏ (billing issue)
- Request Logs: từng request được route đến provider nào
- Usage Analytics: token consumption theo ngày/tuần/model
Không cần gõ lệnh CLI — tất cả visible qua GUI desktop.
Use Case Thực Tế: "OpenClaw Multi-Agent"
Kịch bản: Bạn dùng Claude Pro ($20/month) và ChatGPT Plus ($20/month). Thay vì bị block khi một bên hết quota trong giờ cao điểm, setup này tự động phân phối load:
Sáng (8-12h): Claude xử lý phần lớn request
12h: Claude bị rate limit
↓ auto failover
12h-14h: GPT-4o takes over
14h: Claude cooldown reset
↓ trở lại Claude
14h-18h: Round-robin giữa 2 provider
Kết quả: không có downtime, agent luôn phản hồi, tổng token effective gần như x2.
Lưu Ý
- CLIProxyAPI cần CLI agents tương ứng đã được đăng nhập (OAuth session active)
- Không để CLIProxyAPI expose ra internet — chỉ
localhosthoặc qua Tailscale - Nếu dùng ProxyPal, đảm bảo CLIProxyAPI daemon đang chạy trước khi OpenClaw start
Tài nguyên:
- 🐙 OpenClaw: github.com/openclaw/openclaw
- 📚 Model Failover docs: docs.openclaw.ai/concepts/model-failover
- 🖥️ ProxyPal: proxypal.app