Gemini 能耗的隱藏真相:為什麼 TPUs 只佔 58%、冷卻與備援機器也可能是最大耗電元凶

對於 Google 的 Gemini 應用,其能耗一直是人們關注的焦點。隨著技術的發展和應用的廣泛,了解其能量消耗的組成部分變得尤為重要。在這篇文章中,我們將深入探討 Google Gemini 在單次提示能耗中的隱藏真相,為什麼 TPUs 只佔 58%、而冷卻與備援機器也可能是最大耗電元凶。

Gemini 單次提示能耗

Google 表示,Gemini 的中位數單次提示能耗約為 0.24 瓦時,這一數據成為直接的 AI 能量消耗(per-prompt energy) 的量測結果。令人著迷的是,TPUs 的耗能僅佔約 58%,其餘能量消耗則來自於主機 CPU、備援閒置機器以及資料中心的冷卻系統。這提醒我們在評估 AI 能耗時,不能僅僅著眼於晶片本身。
TPU 佔比析論
* 58% 能耗來自於專用的 AI 芯片。
* 類比:這就像家裡的電器中最耗電的冰箱,對能源消耗舉足輕重。

能耗衡量的範圍與方法

在 Gemini 的能耗報告中,Google 不僅考慮 TPU,還將主機 CPU/記憶體、備援閒置機器以及資料中心運營(如冷卻與電力轉換)等因素納入評估範圍,並以市場化方法做碳足跡估算。這種全面衡量的方法,不僅更加準確地反映了實際的數據中心用電,亦揭示了其碳排放的情形。
報告方法論
* 包含所有相關硬體與運營基礎設施。
* 以碳排放和水資源使用作為參考維度。

能耗飆降與效率趨勢

Google 報告顯示,Gemini 的中位提示能耗在 2024 年 5 月到 2025 年 5 月期間下降約 33 倍,這一現象主要歸功於模型與軟體的優化。這表明,AI 能耗已經開始快速改善。
技術發展帶來的效率提升
* 軟硬體協同優化帶來的顯著成效。
* 這種效能提升類比於手機技術的快速進化。

> 這種趨勢顯示,儘管技術效率在提高,但總體的數據中心能耗仍然受使用量的影響。

冷卻與備援的隱性成本

雖然 TPUs 是主要的計算元件,但主機 CPU/記憶體佔約 25%,備援閒置機器約佔 10%,而資料中心運營(包括冷卻與電力轉換)佔 8%。這些數據顯示,冷卻與備援系統可能是整體耗電的重要來源之一。
冷卻與備援系統的影響
從數據中心用電與 per-prompt energy* 的角度看,降低備援閒置與改善冷卻效率可能更有效於減少碳足跡。
* 引發的行動思考:是否應更多注重於基礎設施的全面升級?

可持續 AI 的路徑與政策

展望未來,一個更標準化的 AI 能源評分體系(例如 Energy Star)與統一的碳足跡估算方法,將促使 Google Gemini 類服務透明披露它們的 per-prompt energy 和總量數據。
政策與技術的共同推動
* 政府與企業參與制定更開放的能耗報告標準。
* 增加對再生能源的採購與使用。

行動呼籲與業界建議

若你是研究者或企業採購方,建議你應要求廠商提供 per-prompt energy 與完整的數據中心用電分項,並將 AI 能源消耗 列入評估指標。推動標準化報告、投資冷卻與備援優化,以及優先選擇能夠有意義地使用再生能源供應商,是實務上的第一步。
– Building a sustainable path is similar to constructing a building—every supportive structure, however small, contributes to the stability and efficiency of the entire building.

閱讀更多相關報導:

Google Gemini 的能耗與效率分析詳細技術報告
> 這份報告不僅提供更開放的數據,亦揭示了我們在追求 AI 可持續性過程中需要面對的挑戰和機遇。

Similar Posts