• 学习时长

    11周/建议每周8个小时

  • 答疑服务

    专属微信答疑群/讲师直接参与

  • 作业批改

    每章节设计作业/及时批改评优

支持花呗分期

 

 

  • 第1章: 概述
  • 1-1:【课件】强化学习概述.pdf 敬请期待
  • 免费 1-2:【视频】强化学习概述 敬请期待
  • 1-3:【作业】homework 1.pdf 敬请期待
  • 1-4:【代码】code1.rar 敬请期待
  • 第2章: 马尔可夫决策过程
  • 2-1:【视频】马尔可夫决策过程(上) 敬请期待
  • 2-2:【视频】马尔可夫决策过程(下) 敬请期待
  • 3-1:【资料】Existence of Optimal Policies.pdf 敬请期待
  • 3-2:【课件】马尔可夫决策过程.pdf 敬请期待
  • 3-3:【作业】hw2.pdf 敬请期待
  • 3-4:【代码】code2.rar 敬请期待
  • 第3章: 动态规划
  • 4-1:【课件】动态规划.pdf 敬请期待
  • 4-2:【视频】动态规划 敬请期待
  • 4-3:【作业】hw3.pdf 敬请期待
  • 4-4:【代码】code3.rar 敬请期待
  • 第4章: 无模型方法一:蒙特卡洛
  • 5-1:【资料】RL with replacing eligibility traces.pdf 敬请期待
  • 5-2:【课件】无模型方法一——蒙特卡洛.pdf 敬请期待
  • 5-3:【视频】无模型方法一——蒙特卡洛 敬请期待
  • 5-4:【作业】hw4.pdf 敬请期待
  • 第5章: 无模型方法二:时间差分
  • 6-1:【课件】无模型方法二:时间差分.pdf 敬请期待
  • 6-2:【视频】无模型方法二:时间差分 敬请期待
  • 6-3:【作业】hw5.pdf 敬请期待
  • 第6章: 无模型方法三:多步自举
  • 7-1:【资料】true online TD(lambda).pdf 敬请期待
  • 7-2:【课件】无模型方法三:多步自举.pdf 敬请期待
  • 7-3:【视频】无模型方法三:多步自举 敬请期待
  • 7-4:【作业】hw6.pdf 敬请期待
  • 第7章: 函数近似与深度网络
  • 8-1:【课件】函数近似与深度网络.pdf 敬请期待
  • 8-2:【视频】函数近似与深度网络 敬请期待
  • 8-3:【作业】hw7.pdf 敬请期待
  • 第8章: 策略梯度算法
  • 9-1:【课件】策略梯度算法.pdf 敬请期待
  • 9-2:【视频】策略梯度算法 敬请期待
  • 9-3:【作业】hw8.pdf 敬请期待
  • 第9章: 深度强化学习
  • 10-1:【视频】深度强化学习(1) 敬请期待
  • 10-2:【课件】深度强化学习.pdf 敬请期待
  • 10-3:【视频】深度强化学习(2) 敬请期待
  • 10-4:【作业】hw9.pdf 敬请期待
  • 第10章: 基于模型的强化学习
  • 11-1:【课件】基于模型的强化学习 敬请期待
  • 11-2:【视频】基于模型的强化学习 敬请期待
  • 11-3:【作业】hw10.pdf 敬请期待
  • 第11章: 前景与大作业
  • 12-1:【课件】强化学习前沿.pdf 敬请期待
  • 12-2:【视频】强化学习前沿 敬请期待
  • 12-3:hw11.pdf 敬请期待

未注册验证后自动登录,注册/登录则视为同意

《服务协议》《隐私协议》

请完善资料,让我们更好的为您服务!

+86  (手机号已绑定)

未注册验证后自动登录,注册/登录则视为同意

《服务协议》《隐私协议》