Hugging Face BlogMay 31, 2023, 12:00 AM重要 75

Introducing the Hugging Face LLM Inference Container for Amazon SageMaker

Hugging Face 與 AWS 合作推出全新 SageMaker LLM 推理容器,整合 TGI 技術,大幅簡化並加速大規模語言模型部署。

Hugging Face 宣布推出專為 Amazon SageMaker 設計的全新深度學習容器(DLC),用於部署大型語言模型(LLM)。該容器整合了 Text Generation Inference (TGI) 技術,支援張量並行、動態批處理與 Token 串流。開發者現在能以極低延遲與高吞吐量,在 AWS 託管環境中輕鬆部署 Falcon、Llama 等開源大模型。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。