Hugging Face BlogJul 29, 2024, 12:00 AM重要 82

Serverless Inference with Hugging Face and NVIDIA NIM

Hugging Face 與 NVIDIA 合作推出由 NVIDIA NIM 驅動的無伺服器推論服務,讓開發者能以極低延遲輕鬆部署開源模型。

Hugging Face 宣布與 NVIDIA 深度整合,在 Hugging Face Hub 上推出全新「無伺服器推論 (Serverless Inference)」服務。該服務由 NVIDIA NIM 微服務與 DGX Cloud 驅動,開發者無需管理複雜的 GPU 基礎設施,即可一鍵部署 Llama 3、Mistral 等熱門開源模型,並享有 TensorRT 優化帶來的極致效能與低延遲。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。