Đọc · 10 phút Cập nhật 30/04/2026 Cấp độ · Cơ bản

Hiểu chi phí Zeni Cloud

Cost Dashboard hiển thị bốn metrics quan trọng — Requests, AI Tokens, Storage, Router USD. Trang này giải thích từng metric, quota theo tier, và những thủ thuật giúp giảm 70 phần trăm hoá đơn tháng.

Bốn metrics chính

REQ

Requests

Tổng số HTTP request đến mọi endpoint API — REST, webhook, function.

req / tháng
TOK

AI Tokens

Tổng input + output tokens qua ZeniRouter (mọi model, mọi tier).

tokens / tháng
STO

Storage

Database size, file storage, vector storage cộng dồn.

GB / tháng
USD

Router USD

Chi phí thực tế bằng USD cho AI calls — tổng từ actual_cost_usd mỗi response.

USD / tháng

Quota theo tier

MetricFreeStarter $9Pro $49Enterprise
Requests50K/th500K/th5M/thTuỳ chỉnh
AI Tokens200K/ngày2M/ngày20M/ngàyTuỳ chỉnh
Storage1 GB10 GB100 GBTuỳ chỉnh
Router credit$1 free$5 free$30 freeNegotiate
Cron jobs350500Không giới hạn
Custom domainKhông5 domain50 domainKhông giới hạn
Free tier không giới hạn thời gian
Khác Vercel/Netlify, free tier Zeni vĩnh viễn miễn phí. Bạn không bị buộc upgrade nếu giữ trong giới hạn.

Ví dụ quota dashboard

Giả sử bạn đang dùng gói Starter, đầu tháng tiêu thụ:

Requests 320,000 / 500,000
64 phần trăm — còn 180K req
AI Tokens (hôm nay) 1.2M / 2M
60 phần trăm — reset 0h00 sáng mai
Storage 3.4 / 10 GB
Router USD $2.85 / $5 free credit
Sau khi hết credit, tính theo giá actual

Chiến lược 80/15/5 — giải thích chi tiết

Phân tích 1.000 request thực tế của một startup SaaS:

So sánh nếu gọi Opus cho TẤT CẢ 1.000 req:

Tiết kiệm = $25 - $1.78 = $23.22 / 1.000 req (~93 phần trăm)

Tối ưu chi phí — checklist

1. Bật cache

Câu hỏi lặp lại trả về từ cache, gần như miễn phí. Hit rate 30-50 phần trăm điển hình cho chatbot:

json{
  "messages": [...],
  "cache": {"mode": "semantic", "ttl_seconds": 3600}
}

2. Batch request

Gộp nhiều request thành 1 thay vì gọi liên tiếp:

python# Xấu — 100 request riêng
for item in items:
    classify(item)  # 100 round trips, 100 token overhead

# Tốt — 1 request batch
classify_batch(items)  # 1 round trip, share system prompt

3. Đặt task_type chính xác

Đừng để mặc định. Khai báo đúng task_type giúp router chọn model rẻ nhất:

python# Xấu - không chỉ định task_type
ai_complete("Phân loại email này")  # Có thể bị route Sonnet

# Tốt - chỉ định rõ
ai_complete("Phân loại email này", task_type="classify")  # Route Gemma 4, rẻ nhất

4. Cap max_tokens

Output 200 tokens đủ cho FAQ, không cần 4000:

json{
  "messages": [...],
  "max_tokens": 200
}

5. Ưu tiên Flash khi có thể

Flash đủ tốt cho 80 phần trăm task. Chỉ dùng Sonnet/Opus khi thực sự cần reasoning sâu.

6. Set quota alert

Trong dashboard, set alert ở 80 phần trăm để có thời gian xử lý trước khi 429:

bashcurl -X POST "https://zenicloud.io/api/v1/alerts?ws=prod" \
  -H "Authorization: Bearer $ZENI_TOKEN" \
  -d '{
    "metric": "ai_tokens_daily",
    "threshold_pct": 80,
    "channel": "email",
    "recipient": "ops@example.com"
  }'

Per-product breakdown

API /usage/breakdown trả về phân loại theo từng product:

bashcurl "https://zenicloud.io/api/v1/usage/breakdown?ws=prod&period=2026-04" \
  -H "Authorization: Bearer $ZENI_TOKEN"
json{
  "period": "2026-04",
  "total_usd": 4.27,
  "breakdown": {
    "router": {
      "calls": 12450,
      "input_tokens": 2840000,
      "output_tokens": 980000,
      "cost_usd": 3.12,
      "by_tier": {
        "fast": {"calls": 9960, "cost": 0.99},
        "balanced": {"calls": 1867, "cost": 1.40},
        "deep": {"calls": 623, "cost": 0.73}
      }
    },
    "ocr": {"pages": 540, "cost_usd": 0.81},
    "translate": {"chars": 120000, "cost_usd": 0.24},
    "vector": {"queries": 8500, "storage_gb": 2.1, "cost_usd": 0.10}
  }
}

Hoá đơn VAT đỏ Việt Nam

FAQ ngắn

Quota reset khi nào? AI tokens reset 0h00 sáng (Asia/Ho_Chi_Minh). Requests và Storage tính theo tháng calendar.

Vượt quota thì sao? Trả 429 với header Retry-After. Bạn có thể bật auto-upgrade trong settings để tự đẩy lên gói cao hơn khi vượt 90 phần trăm.

Hoá đơn USD hay VND? Mặc định USD. Có thể yêu cầu xuất VND theo tỷ giá Vietcombank ngày phát hành.

Bước tiếp theo