Hugging Face BlogApr 17, 2023, 12:00 AM重要 70

Accelerating Hugging Face Transformers with AWS Inferentia2

Hugging Face 推出 optimum-neuron,讓開發者能在 AWS Inferentia2 (Inf2) 晶片上輕鬆編譯與加速部署 Transformers 模型。

Hugging Face 與 AWS 合作,透過 optimum-neuron 工具套件,簡化了在 AWS Inferentia2 (Inf2) 實例上部署 Transformers 模型的流程。開發者現在可以輕鬆將 PyTorch 模型編譯並運行於專為深度學習推理設計的 Inf2 晶片上。這項整合不僅大幅降低了雲端推理成本,還顯著提升了模型吞吐量並降低延遲。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。