AI
Builder Hub
OpenClaw + CLIProxyAPI + ProxyPal: Dùng Nhiều AI Provider, Không Lo Token Limit
buildAI2026-03-179 phút

OpenClaw + CLIProxyAPI + ProxyPal: Dùng Nhiều AI Provider, Không Lo Token Limit

Hướng dẫn cài đặt và cấu hình OpenClaw kết hợp CLIProxyAPI và ProxyPal để sử dụng Claude, GPT-4o, Gemini, Qwen cùng lúc — load balancing, auto failover và monitor token usage qua GUI desktop tiện lợi.

Một trong những điểm đau lớn nhất khi dùng AI agent cho công việc hàng ngày là token limit — đang giữa chừng task thì Claude hoặc GPT-4o báo "rate limit exceeded" và phải chờ. Giải pháp: kết hợp CLIProxyAPI + ProxyPal với OpenClaw để chạy nhiều provider song song, tự động failover khi hết quota.

Kiến trúc OpenClaw + CLIProxyAPI + ProxyPal – load balancing nhiều AI provider

OpenClaw → CLIProxyAPI → Claude / GPT-4o / Gemini / DeepSeek / Qwen — tự động chuyển provider khi hết quota


3 Thành Phần Trong Stack

1. OpenClaw 🦞

AI personal agent local-first — chạy task, kết nối Telegram/Discord, quản lý file, duyệt web. Đọc bài setup OpenClaw nếu chưa cài.

2. CLIProxyAPI

Proxy server wrap các CLI AI model (Claude Code, Gemini CLI, OpenAI Codex, Qwen Code) thành API endpoint tương thích OpenAI/Gemini/Claude. Không cần API key riêng — dùng thẳng subscription đang có.

Tính năng chính:

  • Wrap CLI agents → chuẩn OpenAI API format
  • Round-robin load balancing nhiều account
  • Auto failover khi một provider bị rate limit
  • Hỗ trợ OAuth (không cần expose API key)

3. ProxyPal

Desktop GUI quản lý CLIProxyAPI — giao diện desktop để thêm provider, xem token usage, monitor request logs mà không cần chạm đến CLI.

Tính năng:

  • Quản lý subscriptions: Claude, ChatGPT, Gemini, GitHub Copilot
  • GitHub Copilot Bridge
  • Antigravity Support
  • Usage analytics + token monitoring real-time
  • Tự động detect và config CLI agents đã cài

Cách Hoạt Động

Bạn nhắn Telegram → OpenClaw nhận → gửi request → CLIProxyAPI
                                                        │
                              ┌─────────────────────────┤
                              ▼                         ▼
                        Claude Code CLI           GPT-4o CLI
                        (primary)                (fallback 1)
                              │ rate limited?
                              ▼
                        Gemini CLI               Qwen Code CLI
                        (fallback 2)             (fallback 3)

CLIProxyAPI xử lý logic:

  1. Gửi request đến primary provider (Claude)
  2. Nếu bị rate limit → cooldown 1 phút → 5 phút → 25 phút → 1 giờ
  3. Tự động chuyển sang fallback tiếp theo trong danh sách
  4. Nếu billing issue → backoff 5 giờ, tăng dần đến 24 giờ
  5. OpenClaw nhận kết quả — không biết provider nào đã xử lý

Cài Đặt

Bước 1: Cài CLIProxyAPI

npm install -g cliproxyapi@latest
# hoặc:
pnpm add -g cliproxyapi@latest

Bước 2: Cài CLI Agents Cần Dùng

Cài các CLI agent bạn có subscription:

# Claude Code
npm install -g @anthropic-ai/claude-code

# Gemini CLI (Google)
npm install -g @google/gemini-cli

# OpenAI Codex CLI
npm install -g @openai/codex

Bước 3: Cài ProxyPal (GUI Desktop)

Tải ProxyPal từ proxypal.app — có bản cho macOS, Windows và Linux.

Sau khi mở ProxyPal:

  1. Nó tự detect các CLI agents đã cài
  2. Thêm subscription credentials
  3. Bật toggle cho từng provider muốn dùng

Bước 4: Khởi Chạy CLIProxyAPI Server

# Chạy server (mặc định port 4141):
cliproxyapi start --port 4141

# Hoặc để chạy nền:
cliproxyapi start --port 4141 --daemon

Kiểm tra server đang chạy:

curl http://localhost:4141/v1/models

Cấu Hình OpenClaw Kết Nối CLIProxyAPI

Chỉnh ~/.openclaw/openclaw.json:

{
  "agent": {
    "model": "anthropic/claude-opus-4-6",
    "model": {
      "primary": "anthropic/claude-opus-4-6",
      "fallbacks": [
        "openai/gpt-4o",
        "google-antigravity/gemini-2.5-pro",
        "openai/gpt-4o-mini"
      ]
    }
  },
  "providers": {
    "anthropic": {
      "baseUrl": "http://localhost:4141/anthropic"
    },
    "openai": {
      "baseUrl": "http://localhost:4141/openai"
    },
    "google-antigravity": {
      "baseUrl": "http://localhost:4141/gemini"
    }
  }
}

Giải thích:

  • primary → model được dùng đầu tiên
  • fallbacks → danh sách provider dự phòng theo thứ tự ưu tiên
  • baseUrl → trỏ về CLIProxyAPI thay vì API cloud trực tiếp

Cấu Hình Failover Nâng Cao

Điều Chỉnh Cooldown

{
  "auth": {
    "cooldowns": {
      "billingBackoffHours": 5,
      "billingMaxHours": 24,
      "failureWindowHours": 24
    }
  }
}
KeyMặc địnhÝ nghĩa
billingBackoffHours5hThời gian chờ đầu tiên khi billing issue
billingMaxHours24hThời gian chờ tối đa
failureWindowHours24hReset error counter nếu không fail trong khoảng này

Multi-Account Cho Cùng Một Provider

Nếu bạn có 2 account Claude, CLIProxyAPI round-robin giữa chúng:

File auth-profiles.json (~/.openclaw/agents/<agentId>/agent/auth-profiles.json):

{
  "profiles": {
    "anthropic:account1@gmail.com": {
      "type": "oauth",
      "provider": "anthropic",
      "email": "account1@gmail.com"
    },
    "anthropic:account2@gmail.com": {
      "type": "oauth",
      "provider": "anthropic",
      "email": "account2@gmail.com"
    }
  }
}

OpenClaw sẽ:

  1. Dùng account1 trước (oldest last used first)
  2. Khi account1 bị rate limit → cooldown → chuyển sang account2
  3. Khi cả 2 bị rate limit → chuyển sang model fallback tiếp theo

Monitor Qua ProxyPal GUI

Sau khi setup xong, mở ProxyPal để xem:

  • Dashboard: request count / token usage real-time
  • Provider Status: màu xanh (active), vàng (cooldown), đỏ (billing issue)
  • Request Logs: từng request được route đến provider nào
  • Usage Analytics: token consumption theo ngày/tuần/model

Không cần gõ lệnh CLI — tất cả visible qua GUI desktop.


Use Case Thực Tế: "OpenClaw Multi-Agent"

Kịch bản: Bạn dùng Claude Pro ($20/month) và ChatGPT Plus ($20/month). Thay vì bị block khi một bên hết quota trong giờ cao điểm, setup này tự động phân phối load:

Sáng (8-12h): Claude xử lý phần lớn request
12h: Claude bị rate limit
           ↓ auto failover
12h-14h: GPT-4o takes over
14h: Claude cooldown reset
           ↓ trở lại Claude
14h-18h: Round-robin giữa 2 provider

Kết quả: không có downtime, agent luôn phản hồi, tổng token effective gần như x2.


Lưu Ý

  • CLIProxyAPI cần CLI agents tương ứng đã được đăng nhập (OAuth session active)
  • Không để CLIProxyAPI expose ra internet — chỉ localhost hoặc qua Tailscale
  • Nếu dùng ProxyPal, đảm bảo CLIProxyAPI daemon đang chạy trước khi OpenClaw start

Tài nguyên: