Hugging Face BlogMay 22, 2024, 12:00 AM重要 75

Deploy models on AWS Inferentia2 from Hugging Face

Hugging Face 推出新功能,支援在 Inference Endpoints 中一鍵將模型部署至高性價比的 AWS Inferentia2 晶片。

Hugging Face 宣布其託管服務 Inference Endpoints 正式支援 AWS Inferentia2 (Inf2) 執行個體。這項整合讓開發者無需繁瑣的編譯設定,即可將 Llama、Mistral 等大型語言模型部署至 AWS 的專屬推論晶片上。相較於傳統 GPU,Inferentia2 能大幅降低推論成本並提升吞吐量,為企業提供更具成本效益的生產環境部署選擇。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。