Hugging Face BlogMay 20, 2022, 12:00 AM

An Introduction to Q-Learning Part 2/2

Hugging Face 深度強化學習課程第二部分,帶領讀者動手實作 Q-Learning 演算法並訓練 Agent。

本文為 Hugging Face 深度強化學習系列教程中 Q-Learning 的後半部分。內容專注於 Q-Learning 演算法的具體執行步驟,詳細解析 Epsilon-Greedy 策略如何平衡「探索與利用」,並引導讀者使用 Python 與 Gymnasium 庫在 FrozenLake 等經典環境中從零實作 Q-Table,最後將訓練好的 Agent 上傳至 Hugging Face Hub。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。