课程价格 :
¥599.00
剩余名额
0
-
学习时长
11周/建议每周8个小时
-
答疑服务
专属微信答疑群/讲师直接参与
-
作业批改
每章节设计作业/及时批改评优
- 第1章: 概述
- 1-1:【课件】强化学习概述.pdf
- 免费 1-2:【视频】强化学习概述
- 1-3:【作业】homework 1.pdf
- 1-4:【代码】code1.rar
- 第2章: 马尔可夫决策过程
- 2-1:【视频】马尔可夫决策过程(上)
- 2-2:【视频】马尔可夫决策过程(下)
- 3-1:【资料】Existence of Optimal Policies.pdf
- 3-2:【课件】马尔可夫决策过程.pdf
- 3-3:【作业】hw2.pdf
- 3-4:【代码】code2.rar
- 第3章: 动态规划
- 4-1:【课件】动态规划.pdf
- 4-2:【视频】动态规划
- 4-3:【作业】hw3.pdf
- 4-4:【代码】code3.rar
- 第4章: 无模型方法一:蒙特卡洛
- 5-1:【资料】RL with replacing eligibility traces.pdf
- 5-2:【课件】无模型方法一——蒙特卡洛.pdf
- 5-3:【视频】无模型方法一——蒙特卡洛
- 5-4:【作业】hw4.pdf
- 第5章: 无模型方法二:时间差分
- 6-1:【课件】无模型方法二:时间差分.pdf
- 6-2:【视频】无模型方法二:时间差分
- 6-3:【作业】hw5.pdf
- 第6章: 无模型方法三:多步自举
- 7-1:【资料】true online TD(lambda).pdf
- 7-2:【课件】无模型方法三:多步自举.pdf
- 7-3:【视频】无模型方法三:多步自举
- 7-4:【作业】hw6.pdf
- 第7章: 函数近似与深度网络
- 8-1:【课件】函数近似与深度网络.pdf
- 8-2:【视频】函数近似与深度网络
- 8-3:【作业】hw7.pdf
- 第8章: 策略梯度算法
- 9-1:【课件】策略梯度算法.pdf
- 9-2:【视频】策略梯度算法
- 9-3:【作业】hw8.pdf
- 第9章: 深度强化学习
- 10-1:【视频】深度强化学习(1)
- 10-2:【课件】深度强化学习.pdf
- 10-3:【视频】深度强化学习(2)
- 10-4:【作业】hw9.pdf
- 第10章: 基于模型的强化学习
- 11-1:【课件】基于模型的强化学习
- 11-2:【视频】基于模型的强化学习
- 11-3:【作业】hw10.pdf
- 第11章: 前景与大作业
- 12-1:【课件】强化学习前沿.pdf
- 12-2:【视频】强化学习前沿
- 12-3:hw11.pdf
- 第12章: 作业参考答案
- 13:【参考答案】章节作业参考答案.rar