Hugging Face BlogJun 7, 2024, 12:00 AM重要 75
Introducing the Hugging Face Embedding Container for Amazon SageMaker
Hugging Face 推出專為 Amazon SageMaker 優化的 Embedding 容器,基於 TEI 技術提供低延遲、高吞吐量的向量部署方案。
Hugging Face 與 AWS 合作推出全新 Deep Learning Container (DLC),專為 Amazon SageMaker 上的文字嵌入(Embedding)與序列分類模型進行優化。此容器基於 Hugging Face 的 Text Embeddings Inference (TEI) 技術,支援動態批處理與 Flash Attention,能顯著降低延遲並提高吞吐量,簡化了在 AWS 上部署 RAG 應用的流程。
想看英文原文 / 完整內容?
前往 Hugging Face Blog 原文 →摘要由 AI 整理,以原文為準。