Google Cloud 與 Intel、Hugging Face 合作,在搭載第五代 Intel Xeon 處理器的 C4 實例上運行開源 GPT 模型。透過 Intel AMX 硬體加速與 Hugging Face Optimum 軟體優化,顯著提升推論效能。這項整合為企業帶來高達 70% 的總體擁有成本(TCO)改善,提供更具性價比的 CPU 推論選擇。
Hugging Face 與 Google Cloud 合作,正式將 TPU(如 TPU v5e)引入其平台。用戶現在可以在 Hugging Face Spaces 和 Inference Endpoints 中直接選擇 TPU 作為硬體加速器。這項整合為部署大型語言模型和擴散模型提供了極具性價比的 GPU 替代方案,大幅降低了雲端推理的成本與門檻。