Hugging Face BlogMar 28, 2022, 12:00 AM
Introducing Decision Transformers on Hugging Face 🤗
Hugging Face 宣布整合 Decision Transformer,將強化學習問題轉化為 GPT 式的序列建模任務。
Hugging Face 宣布在其 transformers 函式庫中正式支援 Decision Transformer (DT)。此模型顛覆傳統強化學習(RL)方法,不使用價值函數或策略梯度,而是將狀態、動作與目標回報視為序列,利用類似 GPT 的自注意力機制來預測下一步動作。這項整合大幅降低了離線強化學習(Offline RL)的門檻,讓開發者能用熟悉的 Transformer 工具鏈進行決策模型的訓練。
想看英文原文 / 完整內容?
前往 Hugging Face Blog 原文 →摘要由 AI 整理,以原文為準。