Hugging Face BlogSep 26, 2023, 12:00 AM

Llama 2 on Amazon SageMaker a Benchmark

Hugging Face 發布 Llama 2 在 Amazon SageMaker 上的效能基準測試,提供最佳 GPU 實例與成本效益建議。

Hugging Face 針對 Llama 2 (7B、13B、70B) 在 Amazon SageMaker 上的部署進行了全面的效能基準測試。測試涵蓋了多種 AWS g5 與 p4 實例,評估指標包括首字延遲 (TTFT)、吞吐量 (tokens/sec) 與成本。這份指南能幫助開發者在部署開源大模型時,在效能與雲端預算之間取得最佳平衡。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。