INSIDE frames enterprise AI through a sharp ROI gap: a 2025 MIT survey said 95% of companies had not seen returns despite massive AI spending. It also cites Gartner’s forecast that Fortune 500 companies may average 150,000 agents by 2028. The article focuses on Google Cloud’s view of how enterprises should prepare for AI agents and allocate IT budgets for real deployment.
Google Cloud 與 Intel、Hugging Face 合作,在搭載第五代 Intel Xeon 處理器的 C4 實例上運行開源 GPT 模型。透過 Intel AMX 硬體加速與 Hugging Face Optimum 軟體優化,顯著提升推論效能。這項整合為企業帶來高達 70% 的總體擁有成本(TCO)改善,提供更具性價比的 CPU 推論選擇。
Hugging Face 與 Google Cloud 合作,正式將 TPU(如 TPU v5e)引入其平台。用戶現在可以在 Hugging Face Spaces 和 Inference Endpoints 中直接選擇 TPU 作為硬體加速器。這項整合為部署大型語言模型和擴散模型提供了極具性價比的 GPU 替代方案,大幅降低了雲端推理的成本與門檻。