Hugging Face BlogMay 20, 2022, 12:00 AM
An Introduction to Q-Learning Part 2/2
Hugging Face 深度強化學習課程第二部分,帶領讀者動手實作 Q-Learning 演算法並訓練 Agent。
本文為 Hugging Face 深度強化學習系列教程中 Q-Learning 的後半部分。內容專注於 Q-Learning 演算法的具體執行步驟,詳細解析 Epsilon-Greedy 策略如何平衡「探索與利用」,並引導讀者使用 Python 與 Gymnasium 庫在 FrozenLake 等經典環境中從零實作 Q-Table,最後將訓練好的 Agent 上傳至 Hugging Face Hub。
想看英文原文 / 完整內容?
前往 Hugging Face Blog 原文 →摘要由 AI 整理,以原文為準。