Hugging Face BlogSep 8, 2022, 12:00 AM重要 72

Train your first Decision Transformer

Hugging Face 官方教學:教你如何將強化學習視為序列建模,訓練第一個 Decision Transformer。

本教學為 Hugging Face 官方指南,介紹如何訓練第一個 Decision Transformer (DT)。DT 將強化學習(RL)重新框架為序列建模問題,利用 Transformer 架構預測動作。教學涵蓋離線強化學習(Offline RL)的概念、如何使用 Hugging Face 的 `transformers` 庫與 `DecisionTransformerModel`,並在 Gym 環境中進行實作與評估,是結合 NLP 技術與控制任務的經典入門。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。