• 学习时长

    11周/建议每周8个小时

  • 答疑服务

    专属微信答疑群/讲师直接参与

  • 作业批改

    每章节设计作业/及时批改评优

课程价格: 599.00

  • 第1章: 概述
  • 任务1-1: 【课件】强化学习概述.pdf
  • 免费 任务1-2: 【视频】强化学习概述 120:00 预览
  • 任务1-3: 【作业】homework 1.pdf
  • 任务1-4: 【代码】code1.rar
  • 第2章: 马尔可夫决策过程
  • 任务2-1: 【资料】Existence of Optimal Policies.pdf
  • 任务2-2: 【课件】马尔可夫决策过程.pdf
  • 任务2-3: 【视频】马尔可夫决策过程 89:26
  • 任务2-4: 【作业】hw2.pdf
  • 任务2-5: 【代码】code2.rar
  • 第3章: 动态规划
  • 任务3-1: 【课件】动态规划.pdf
  • 任务3-2: 【视频】动态规划 83:49
  • 任务3-3: 【作业】hw3.pdf
  • 任务3-4: 【代码】code3.rar
  • 第4章: 无模型方法一:蒙特卡洛
  • 任务4-1: 【资料】RL with replacing eligibility traces.pdf
  • 任务4-2: 【课件】无模型方法一——蒙特卡洛.pdf
  • 任务4-3: 【视频】无模型方法一——蒙特卡洛 74:36
  • 任务4-4: 【作业】hw4.pdf