Hugging Face BlogMay 10, 2022, 12:00 AM重要 75

Accelerated Inference with Optimum and Transformers Pipelines

Hugging Face 整合 Optimum 與 Pipelines,開發者只需修改幾行程式碼,即可利用 ONNX Runtime 實現模型推論硬體加速。

Hugging Face 介紹了如何將硬體優化工具包 Optimum 與受歡迎的 Transformers Pipelines 整合。開發者現在能直接載入 ONNX 格式模型並傳入 Pipeline 中,在 CPU 或 GPU 上實現顯著的延遲降低與吞吐量提升。這項更新免去了手動導出 ONNX 的繁瑣步驟,極大地簡化了生產環境的部署流程。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。