Rain AI Team · Case Study
📊

LLM 成本優化審計案例版

board-style report · 實戰案例驗證 · 96.5% 成本節省 · 同一套版型與語言
Case Study 96.5% savings Haiku + Free tools Board Format
2026-03-24 · RAIN AI TEAM
SLIDE 02 · SUMMARY

案例摘要

本案例把「AI Infra 成本優化審計」本身當成實戰,驗證低成本模型與免費工具能否完成高品質交付。
CASE
2.5 小時
work time
實戰完成整個審計、修正與報告輸出。
CASE
7 sub-tasks
pipeline depth
修復 / 測試 / 分析 / 報告 / 郵件等流程一起跑。
CASE
96.5%
savings
對比 100% 高階輸出基準,節省極高。
CASE
Haiku 80%
tool usage
大部分任務用低成本層完成。
核心訊息:高品質輸出不等於高成本輸出;真正重要的是把正確任務放到正確模型層。
SLIDE 03 · TASK SPLIT

實戰任務拆分

這次案例不是單一任務,而是一條完整交付鏈:修、測、寫、發。
TaskTools / ModelRole
HTTP 錯誤處理 / Git 恢復Haiku一般修復、結構化分析、低風險 debug
免費工具驗證Chrome MCP點擊、填表、截圖、驗證流程
交叉驗證 / P0 審查Vick / Grok獨立視角、挑戰假設、找盲點
報告與版型Nova / 高階輸出層高品質 HTML deck 與 final output
郵件與通知Bash + Kai輸出與交付,不浪費高階模型

成功用法

  • Haiku:HTTP 錯誤處理、Git 版本恢復、任務分類、結構化分析。
  • Chrome MCP:點擊、填表、驗證、screenshot。
  • Vick / Grok:交叉驗證與異見審查。

必保高階用法

  • Deck 報告的最終版面與文字收斂(高階輸出層)。
  • 結論與風險邊界的最後簽核。
  • 需要高品質敘事與編排的輸出。
SLIDE 04 · COST MODEL

成本對比

對比基準是 100% 高階輸出的理想方案;實戰則混用 Haiku、免費工具與少量高階輸出。
LayerTimeUnit costCost
100% 高階輸出160 min~$21.88/min$3,500
Haiku80 min~$0.80/min$64
Chrome MCP20 min$0$0
Nova / 高階輸出層30 min~$2.50/min$75
Vick / Grok20 min$20/mo amortized$0.66
Bash + Kai10 min$0$0
Total160 min$140
節省率:96.5% | $140 vs $3,500
SLIDE 05 · RESULTS

案例結果

結果不是「省錢而已」,而是證明低階模型 + 免費工具足以完成大部分工程與報告任務。
result
Haiku 成功
HTTP / Git / analysis
低風險修復與結構化分析成功由 Haiku 承擔。
result
Chrome MCP 成功
testing
驗證、截圖、點擊、填表這些 UI 任務不該浪費高階模型。
result
Grok 成功
cross-check
獨立視角抓出 3 個關鍵問題,提升整體可靠性。
result
高階輸出必保
final deck
只有最終報告整編與敘事收斂需要高階輸出。
Applied RuleEvidenceConclusion
低風險任務先走 L0/L1Haiku 完成大多數工程操作Validated
免費工具優先Chrome MCP 完成驗證流程Validated
高風險任務保留高階模型報告收斂 / 敘事 / final reviewNecessary
異見稽核Vick / Grok 找到 3 個關鍵問題Useful
結論:這個案例證明三層路由不是理論,而是已被實戰驗證的成本治理手法。
SLIDE 06 · TAKEAWAYS

可複用的原則

把正確的任務放在正確的模型層,是唯一能長期壓成本又保品質的做法。

WORKING RULES

1. default 走 L0;2. low-risk 任務升 L1;3. critical 任務才碰 L2。

4. provider 不要單點;5. 失敗要有 degraded result;6. 告警不能靠單一路徑。

What worked

  • Haiku 足以處理大量工程支持性工作。
  • 免費工具可替代一部分「模型工作」。
  • 異見稽核能明顯提高決策品質。

What stays high tier

  • 最終報告整編。
  • 風險與架構簽核。
  • 需要高品質敘事與最終裁決的任務。
一句話總結:你不是缺模型,你是需要更嚴格的任務分類與降級契約。