Hugging Face BlogMay 31, 2023, 12:00 AM重要 75
Introducing the Hugging Face LLM Inference Container for Amazon SageMaker
Hugging Face 與 AWS 合作推出全新 SageMaker LLM 推理容器,整合 TGI 技術,大幅簡化並加速大規模語言模型部署。
Hugging Face 宣布推出專為 Amazon SageMaker 設計的全新深度學習容器(DLC),用於部署大型語言模型(LLM)。該容器整合了 Text Generation Inference (TGI) 技術,支援張量並行、動態批處理與 Token 串流。開發者現在能以極低延遲與高吞吐量,在 AWS 託管環境中輕鬆部署 Falcon、Llama 等開源大模型。
想看英文原文 / 完整內容?
前往 Hugging Face Blog 原文 →摘要由 AI 整理,以原文為準。