AMD 執行長蘇姿丰表示,AI 應用正從訓練快速轉向推論階段,帶動 CPU 需求急遽上升。過去半年至一年內少有人提及的 CPU 短缺問題,自去年底起已出現明顯供需轉變。她預期 CPU 市場將迎來年增 35% 的成長,且硬體架構很快將轉變為 CPU 與 GPU 比例趨近「1:1」的新格局。
本文深入探討全球 AI 算力基礎設施的劇烈變革。隨著地緣政治與市場需求的變化,算力正從少數雲端巨頭壟斷,走向「主權算力」與區域化部署。同時,AMD、Intel 及邊緣裝置晶片的崛起打破了單一硬體壟斷,而開源社群與 Hugging Face 的優化工具(如 Optimum)正成為連接多元硬體與模型的關鍵橋樑,推動 AI 走向去中心化與普及化。
本期 AINews 指出這幾天 AI 領域相對平靜,並無重大新聞發布。編輯特別推薦讀者收聽 Latent.Space 最新釋出的節目,內容聚焦於 SF Compute 以及 GPU 新興雲端服務(Neocloud)的發展與討論。這對於關注 AI 算力基礎設施、GPU 租賃市場與雲端運算趨勢的開發者與創業者來說,是相當值得參考的產業情報。
Replicate 發表最新技術週報,重點包括:1. 介紹如何透過稀疏自編碼器(SAE)在 GPT 模型中定位與提取特定概念;2. 展示利用瀏覽器進行低延遲、隱私安全的即時語音轉文字技術;3. 宣布 Replicate 平台即將迎來 NVIDIA H100 GPU,大幅提升開源模型推理與微調的速度。