Hiểu chi phí Zeni Cloud
Cost Dashboard hiển thị bốn metrics quan trọng — Requests, AI Tokens, Storage, Router USD. Trang này giải thích từng metric, quota theo tier, và những thủ thuật giúp giảm 70 phần trăm hoá đơn tháng.
Bốn metrics chính
Requests
Tổng số HTTP request đến mọi endpoint API — REST, webhook, function.
req / thángAI Tokens
Tổng input + output tokens qua ZeniRouter (mọi model, mọi tier).
tokens / thángStorage
Database size, file storage, vector storage cộng dồn.
GB / thángRouter USD
Chi phí thực tế bằng USD cho AI calls — tổng từ actual_cost_usd mỗi response.
Quota theo tier
| Metric | Free | Starter $9 | Pro $49 | Enterprise |
|---|---|---|---|---|
| Requests | 50K/th | 500K/th | 5M/th | Tuỳ chỉnh |
| AI Tokens | 200K/ngày | 2M/ngày | 20M/ngày | Tuỳ chỉnh |
| Storage | 1 GB | 10 GB | 100 GB | Tuỳ chỉnh |
| Router credit | $1 free | $5 free | $30 free | Negotiate |
| Cron jobs | 3 | 50 | 500 | Không giới hạn |
| Custom domain | Không | 5 domain | 50 domain | Không giới hạn |
Ví dụ quota dashboard
Giả sử bạn đang dùng gói Starter, đầu tháng tiêu thụ:
Chiến lược 80/15/5 — giải thích chi tiết
Phân tích 1.000 request thực tế của một startup SaaS:
- 800 requests (80 phần trăm) — câu hỏi đơn giản, FAQ, classify, tóm tắt ngắn → định tuyến Flash, mỗi req $0.0001 = $0.08
- 150 requests (15 phần trăm) — code review, phân tích trung bình → Sonnet, mỗi req $0.003 = $0.45
- 50 requests (5 phần trăm) — soạn hợp đồng, viết blog dài → Opus, mỗi req $0.025 = $1.25
- Tổng = $1.78 cho 1.000 req
So sánh nếu gọi Opus cho TẤT CẢ 1.000 req:
- 1.000 × $0.025 = $25 — gấp 14 lần
Tiết kiệm = $25 - $1.78 = $23.22 / 1.000 req (~93 phần trăm)
Tối ưu chi phí — checklist
1. Bật cache
Câu hỏi lặp lại trả về từ cache, gần như miễn phí. Hit rate 30-50 phần trăm điển hình cho chatbot:
json{
"messages": [...],
"cache": {"mode": "semantic", "ttl_seconds": 3600}
}
2. Batch request
Gộp nhiều request thành 1 thay vì gọi liên tiếp:
python# Xấu — 100 request riêng
for item in items:
classify(item) # 100 round trips, 100 token overhead
# Tốt — 1 request batch
classify_batch(items) # 1 round trip, share system prompt
3. Đặt task_type chính xác
Đừng để mặc định. Khai báo đúng task_type giúp router chọn model rẻ nhất:
python# Xấu - không chỉ định task_type
ai_complete("Phân loại email này") # Có thể bị route Sonnet
# Tốt - chỉ định rõ
ai_complete("Phân loại email này", task_type="classify") # Route Gemma 4, rẻ nhất
4. Cap max_tokens
Output 200 tokens đủ cho FAQ, không cần 4000:
json{
"messages": [...],
"max_tokens": 200
}
5. Ưu tiên Flash khi có thể
Flash đủ tốt cho 80 phần trăm task. Chỉ dùng Sonnet/Opus khi thực sự cần reasoning sâu.
6. Set quota alert
Trong dashboard, set alert ở 80 phần trăm để có thời gian xử lý trước khi 429:
bashcurl -X POST "https://zenicloud.io/api/v1/alerts?ws=prod" \
-H "Authorization: Bearer $ZENI_TOKEN" \
-d '{
"metric": "ai_tokens_daily",
"threshold_pct": 80,
"channel": "email",
"recipient": "ops@example.com"
}'
Per-product breakdown
API /usage/breakdown trả về phân loại theo từng product:
bashcurl "https://zenicloud.io/api/v1/usage/breakdown?ws=prod&period=2026-04" \
-H "Authorization: Bearer $ZENI_TOKEN"
json{
"period": "2026-04",
"total_usd": 4.27,
"breakdown": {
"router": {
"calls": 12450,
"input_tokens": 2840000,
"output_tokens": 980000,
"cost_usd": 3.12,
"by_tier": {
"fast": {"calls": 9960, "cost": 0.99},
"balanced": {"calls": 1867, "cost": 1.40},
"deep": {"calls": 623, "cost": 0.73}
}
},
"ocr": {"pages": 540, "cost_usd": 0.81},
"translate": {"chars": 120000, "cost_usd": 0.24},
"vector": {"queries": 8500, "storage_gb": 2.1, "cost_usd": 0.10}
}
}
Hoá đơn VAT đỏ Việt Nam
- Mặc định: hoá đơn điện tử PDF gửi email cuối tháng
- Có MST: cập nhật
Settings→Billing→Tax Information - Hoá đơn xuất theo MST của khách, đúng quy định Bộ Tài chính
- Có thể yêu cầu hoá đơn riêng cho mỗi product (gói Pro+)
FAQ ngắn
Quota reset khi nào? AI tokens reset 0h00 sáng (Asia/Ho_Chi_Minh). Requests và Storage tính theo tháng calendar.
Vượt quota thì sao? Trả 429 với header Retry-After. Bạn có thể bật auto-upgrade trong settings để tự đẩy lên gói cao hơn khi vượt 90 phần trăm.
Hoá đơn USD hay VND? Mặc định USD. Có thể yêu cầu xuất VND theo tỷ giá Vietcombank ngày phát hành.
Bước tiếp theo
- AI Router strategy 80/15/5 — chi tiết kỹ thuật
- FAQ — các câu hỏi khác