Showing:amd-mi300ResearchersClear ×
Hugging Face 發布技術指南,介紹如何為 AMD Instinct MI300 系列 GPU 撰寫自訂 Kernel。文章重點介紹利用 OpenAI Triton 框架在 ROCm 生態系中進行開發,讓開發者能用 Python 撰寫高效的 GPU 算子,繞過複雜的 HIP C++。這項技術能顯著提升 LLM 在 AMD 硬體上的推理與訓練效率。