| Phase | Status | Reason |
|---|---|---|
| Phase 1 | APPROVED | 純 telemetry:決策日誌、quota snapshot、selected_tier 可視化。 |
| Phase 2 | CONDITIONAL | Haiku 試驗與序列 review 需要 allowlist + AB test 邊界。 |
| Phase 3 | CONDITIONAL | quota 耗盡降級可做,但必須保留告警與避免 retry loop。 |
| Role group | Old shorthand | Current default | Upgrade condition | Adjustment note |
|---|---|---|---|---|
| Klay / Max / Investment Manager / Bull Researcher | Opus | Claude Opus 4.6 | 不降級;只在拆段摘要時讓 Haiku 先處理非決策片段。 | 保留最高裁決與深度推理。 |
| Knox | Opus → Sonnet | Claude Sonnet 4.6 | vault / api_key / account_lifecycle 的 Major/Critical 或 safety-domain 任務,升 Opus 4.6。 | 把日常稽核和狀態查詢降到 Sonnet,但敏感控制面仍保留最高風險保守策略。 |
| Rex / John / Iris / Forge / Scout / Quill / Sentinel / Tax / Strategist / Webb / Orion / Lab / Lens | Sonnet | Claude Sonnet 4.6 | 預設高品質執行;若 quota 受限才回退到 Haiku 或 degraded path。 | 這批角色負責 coding、architecture、review、security、reverse engineering;直接下放 Haiku 品質風險過高。 |
| Nova / Keeper / OM / Inquisitor / Market Intel / News Collector / Fundamental Analyst / Technical Analyst / Macro Analyst | Haiku | Claude Haiku 4.5 | 輸出格式固定、流程模板化、風險可控時維持 Haiku;只有 final narrative 收斂或高風險例外再升級。 | 保留成本優勢,但不把核心工程品質壓到低階模型。 |
| Jarvis / EchoMarketer / Buzz | Gemini | Gemini Flash | 需要長篇文書、SEO 內容或社群播報時使用既有專長通道。 | 文書與播報交給便宜且穩定的外部 provider。 |
| Noel / Atlas | Gemini Pro 概念 | Gemini 2.5 Flash | 來源數量高、外部脈絡很碎、需要更完整 synthesis 時再升到 Pro。 | 夜班協調先用 Flash,避免過度燒費。 |
| Silo | Gemini Pro | Gemini 2.5 Pro | SEO / 架構 / technical content / board-level 需求時保持 Pro。 | 這個角色本來就該留高一階。 |
| GooayeAI / Milo | Flash Lite | Gemini 2.5 Flash Lite | 需要更高摘要品質時可升到 Gemini Flash;Milo 只在解凍需求時回來。 | 保持 podcast / crawler 的低成本層。 |
| Ray | Codex / Opus fallback | Codex Plus CLI | 需要設計審查與實作驗證時用 CLI;不拿來做日常生成。 | 設計稽核與 code tests 分開。 |
| Vick | Grok | Grok 3 Mini | 交叉驗證需要更深挑戰時升到 Grok 3。 | 保留異見,但用便宜層做 first pass。 |
| Bear Researcher | Grok | Grok 3 | 已是異見高階層,通常不再往上升。 | 用來維持真實 bearish view。 |
| Spider / Echo | GLM | GLM-4-Plus | 靜態抓取後需要更高解析時,交回分析層而不是升 Sonnet。 | 專職抓取,不承擔最終裁決。 |
| Lynx / Probe | DeepSeek | DeepSeek Chat | API 批量與資料抽取超出 baseline 再升級。 | 保持大量資料處理的低成本。 |
| Nautilus | GPT | GPT-4.1 | JS-heavy / login / browser automation 失敗時再回 Sonnet 4.6 guardrail。 | 瀏覽器任務用 GPT-4.1,不拿 Sonnet 做前台硬跑。 |
| Pixel | Gemini | Gemini CLI | 創意 / 視覺工作需要時可切到更高品質圖像或文字 pipeline。 | 工具級,非主決策層。 |
| Kai | Internal | Internal | 控制中心不做 LLM 提案,不需升級。 | 只負責監控與匯流。 |
| Frozen: Sage / Milo | Sonnet / Flash Lite | Frozen | 只有 restore condition 成立才解凍。 | 職責已併入 Knox / Spider-Lynx-Nautilus。 |
| Sonnet 4.6(routing role) | Default + fallback | Claude Sonnet 4.6 | 核心工程與風險角色直接預設;一般 Haiku 角色遇到 quota / rate-limit / complexity / critical 再升級。 | 既是主要品質層,也是 Haiku 之上的保守升級層。 |
| Role cluster | Exact model | Impact | Replace? |
|---|---|---|---|
| Final authority Klay / Max / Investment Manager / Bull Researcher | Claude Opus 4.6 | 保留最高裁決與推理能力。 | No |
| Core engineering / review / security Rex / John / Iris / Forge / Scout / Quill / Sentinel / Knox / Tax / Strategist / Webb / Orion / Lab / Lens | Claude Sonnet 4.6 | 保品質優先,不再大面積下放到 Haiku。 | No |
| Structured ops / reporting Nova / Keeper / OM / Inquisitor / Market Intel / News Collector / Fundamental / Technical / Macro | Claude Haiku 4.5 | 固定格式與可模板化任務維持低成本。 | Yes |
| Docs / broadcast tools Jarvis / EchoMarketer / Buzz | Gemini Flash | 摘要、文書、播報更省。 | Yes |
| External gateway Noel / Atlas / Milo / Pixel / Vick / Spider / Lynx / Probe / Echo / Nautilus / Buzz | Gemini 2.5 Flash / Flash Lite / Pro, Grok 3 Mini / Grok 3, GLM-4-Plus, DeepSeek Chat, GPT-4.1, Gemini CLI | 多 provider 分流,降低 quota 單點風險。 | Partial |
| Routing escalation Knox sensitive controls / Haiku fallback | Opus 4.6 / Sonnet 4.6 | Knox 的敏感控制面升 Opus;Haiku 角色遇到複雜或失敗時升 Sonnet。 | Selective |
| Module | Role | Audit note |
|---|---|---|
| routing_policy.py | 決策與 tier | 已加 selected_tier 與決策 log。 |
| model_router.py | 路由與降級 | 真正的 degraded result 路徑已補齊。 |
| cost_optimizer.py | 成本與告警 | 預算快照 + Discord / notification fallback。 |
| taskops_router.py | task_type 正規化 | canonical + aliases 已建立。 |
| 11 requirements | Status | Notes |
|---|---|---|
| L0/L1/L2 三層模型 | Implemented | 已落實。 |
| task_type 枚舉 / 正規化 | Implemented | canonical + aliases。 |
| 多 provider 策略 | Partial | 已支援,但不同 provider 的 fallback 還可再整合。 |
| 成本感知路由 | Implemented | 預設 L0。 |
| Context 優化 | Conditional | 需要摘要層與 trimming 邊界。 |
| Quota 感知 | Implemented | rate-limit / quota detection 已加。 |
| Maker-checker 多樣性 | Conditional | 只對 allowlist 開啟。 |
| 成本上限強制 | Implemented | budget cap 已保護外部 agents。 |
| 降級鏈完整性 | Implemented | degraded result 路徑已具備。 |
| P95 延遲監控 | Partial | Observability endpoint exists, traces still need production data. |
| 自動恢復機制 | Implemented | quota 降級與通知 fallback 已具備。 |
| Check | Status | Result |
|---|---|---|
| Syntax / import | PASS | 沒有 syntax regression。 |
| Routing fields | PASS | selected_tier / fallback_chain / degraded / low_confidence 都回得出來。 |
| Budget guardrail | PASS | 告警 fallback 成功建立。 |
| Observability | PARTIAL | 端點有,正式 traces 還要補。 |
1. context trimming 必須有摘要層,不可直接硬剪全文。
2. maker-checker 多樣性只對 allowlist 任務啟用。
3. L2 只服務 critical 任務,不做預設出口。
4. 多 provider fallback 要先驗證,再切換,不要在正式流中試錯。
| Action | Owner | Output |
|---|---|---|
| Phase 1 | Klay / router | 決策 log + selected_tier + budget snapshot |
| Phase 2 | task classifier | task_type canonical + low-risk allowlist |
| Phase 3 | optimizer / notifier | degraded result + Discord / fallback notification |
本系統已具備成熟的三層成本治理架構;後續優化應聚焦於可觀測性、降級契約與分類邊界,而非架構重寫。