Hugging Face BlogJul 27, 2022, 12:00 AM

Faster Text Generation with TensorFlow and XLA

Hugging Face 介紹如何利用 TensorFlow 的 XLA 編譯器,大幅提升 Transformers 模型的文本生成速度。

Hugging Face 官方部落格介紹了結合 TensorFlow 與 XLA(加速線性代數)編譯器來優化文本生成的方法。透過在 generate() 函數中啟用 jit_compile=True,開發者可以顯著減少推論延遲。然而,由於 XLA 需要靜態形狀(static shapes),使用時必須對輸入進行固定長度的填充與截斷。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。