Hugging Face 推出全新支援,簡化 AMD ROCm 運算核心(Kernels)的構建與分享。開發者現在可以更輕鬆地在平台上打包與分發適用於 AMD GPU 的自訂運算核心(如 Triton 核心),解決了以往 AMD 生態系中編譯與部署優化核心的痛點,進一步提升 AMD 硬體在 AI 推理與訓練上的效能與易用性。
Hugging Face 發布技術指南,介紹如何為 AMD Instinct MI300 系列 GPU 撰寫自訂 Kernel。文章重點介紹利用 OpenAI Triton 框架在 ROCm 生態系中進行開發,讓開發者能用 Python 撰寫高效的 GPU 算子,繞過複雜的 HIP C++。這項技術能顯著提升 LLM 在 AMD 硬體上的推理與訓練效率。
Hugging Face 宣布與 AMD 展開深度合作,全面優化 AMD Instinct MI300X GPU。透過 AMD ROCm 軟體棧與 Hugging Face 核心庫(如 Transformers、TGI)的無縫整合,開發者無需修改程式碼即可在 MI300X 上運行 Llama 3 等大型模型。MI300X 憑藉 192GB HBM3 超大記憶體,為企業提供極具性價比且能擺脫單一晶片供應商依賴的高效能 AI 算力選擇。
AMD 與 Hugging Face 合作舉辦「Pervasive AI 開發者大賽」,旨在推廣 AMD 的 AI 硬體生態系。競賽分為生成式 AI、機器人 AI 與 PC AI 三大賽道,參賽者需利用 AMD Radeon GPU、Ryzen AI 或 Kria 開發套件,並結合 Hugging Face 的模型進行開發。本活動提供豐富的硬體支援與高達 15 萬美元的總獎金,吸引全球開發者共襄盛舉。
Hugging Face 宣布與 AMD 深度合作,推出 optimum-amd 套件,旨在簡化 AMD GPU(如 Instinct 與 Radeon 系列)上的模型部署與加速。該套件整合了 AMD ROCm 軟體平台,開發者只需修改幾行程式碼,即可在 AMD 硬體上無縫運行並加速主流的大語言模型(LLM)。此舉打破了過去 NVIDIA CUDA 在 AI 訓練與推理上的壟斷,為企業與開發者提供更具性價比的硬體選擇。
Hugging Face 宣佈與 AMD 展開深度合作,旨在為 AMD 的 CPU 和 GPU 平台(包括 Ryzen、EPYC、Radeon 及 Instinct 系列)提供頂級的 AI 模型加速。雙方將共同優化 Hugging Face 的 Optimum 庫,讓開發者能無縫地在 AMD 硬體上部署與訓練 Transformer 模型。此舉為 AI 社群提供了 NVIDIA 之外的高性價比硬體選擇,促進開源 AI 生態的多樣性。
Hugging Face 釋出指南,介紹如何使用 AMD ROCm 軟體棧在單一 AMD GPU 上運行開源大型語言模型。透過 PyTorch 與 Hugging Face 函式庫的整合,開發者與研究人員可以擺脫對 NVIDIA CUDA 的單一依賴,在 AMD 硬體上實現高效能的 AI 聊天機器人部署,並搭配 Gradio 建立互動介面。