强化学习理论与实践 - 深蓝学院 - 专注人工智能与自动驾驶的学习平台

学习时长

11周/建议每周8个小时
答疑服务

专属微信答疑群/讲师直接参与
作业批改

每章节设计作业/及时批改评优

课程价格：￥599.00

已报满

支持花呗分期

已报满

第1章: 概述
1-1：【课件】强化学习概述.pdf 敬请期待
免费 1-2：【视频】强化学习概述敬请期待
1-3：【作业】homework 1.pdf 敬请期待
1-4：【代码】code1.rar 敬请期待

第2章: 马尔可夫决策过程
2-1：【视频】马尔可夫决策过程（上）敬请期待
2-2：【视频】马尔可夫决策过程（下）敬请期待
3-1：【资料】Existence of Optimal Policies.pdf 敬请期待
3-2：【课件】马尔可夫决策过程.pdf 敬请期待
3-3：【作业】hw2.pdf 敬请期待
3-4：【代码】code2.rar 敬请期待

第3章: 动态规划
4-1：【课件】动态规划.pdf 敬请期待
4-2：【视频】动态规划敬请期待
4-3：【作业】hw3.pdf 敬请期待
4-4：【代码】code3.rar 敬请期待

第4章: 无模型方法一：蒙特卡洛
5-1：【资料】RL with replacing eligibility traces.pdf 敬请期待
5-2：【课件】无模型方法一——蒙特卡洛.pdf 敬请期待
5-3：【视频】无模型方法一——蒙特卡洛敬请期待
5-4：【作业】hw4.pdf 敬请期待

第5章: 无模型方法二：时间差分
6-1：【课件】无模型方法二：时间差分.pdf 敬请期待
6-2：【视频】无模型方法二：时间差分敬请期待
6-3：【作业】hw5.pdf 敬请期待

第6章: 无模型方法三：多步自举
7-1：【资料】true online TD(lambda).pdf 敬请期待
7-2：【课件】无模型方法三：多步自举.pdf 敬请期待
7-3：【视频】无模型方法三：多步自举敬请期待
7-4：【作业】hw6.pdf 敬请期待

第7章: 函数近似与深度网络
8-1：【课件】函数近似与深度网络.pdf 敬请期待
8-2：【视频】函数近似与深度网络敬请期待
8-3：【作业】hw7.pdf 敬请期待

第8章: 策略梯度算法
9-1：【课件】策略梯度算法.pdf 敬请期待
9-2：【视频】策略梯度算法敬请期待
9-3：【作业】hw8.pdf 敬请期待

第9章: 深度强化学习
10-1：【视频】深度强化学习（1）敬请期待
10-2：【课件】深度强化学习.pdf 敬请期待
10-3：【视频】深度强化学习（2）敬请期待
10-4：【作业】hw9.pdf 敬请期待

第10章: 基于模型的强化学习
11-1：【课件】基于模型的强化学习敬请期待
11-2：【视频】基于模型的强化学习敬请期待
11-3：【作业】hw10.pdf 敬请期待

第11章: 前景与大作业
12-1：【课件】强化学习前沿.pdf 敬请期待
12-2：【视频】强化学习前沿敬请期待
12-3：hw11.pdf 敬请期待

第12章: 作业参考答案
13：【参考答案】章节作业参考答案.rar 敬请期待

+ 86

中国 +86
美国 +1
日本 +81
中国香港 +852
中国澳门 +853
中国台湾 +886
马来西亚 +60
澳大利亚 +61
加拿大 +1
英国 +44
新加坡 +65
德国 +49
俄罗斯 +7
埃及 +20
南非 +27
希腊 +30
荷兰 +31
比利时 +32
法国 +33
西班牙 +34
匈牙利 +36
意大利 +39
罗马尼亚 +40
瑞士 +41
奥地利 +43
丹麦 +45
瑞典 +46
挪威 +47
波兰 +48
秘鲁 +51
墨西哥 +52
古巴 +53
阿根廷 +54
巴西 +55
智利 +56
哥伦比亚 +57
委内瑞拉 +58
印度尼西亚 +62
菲律宾 +63
新西兰 +64
泰国 +66
哈萨克斯坦 +7
韩国 +82
越南 +84
土耳其 +90
印度 +91
巴基斯坦 +92
阿富汗 +93
斯里兰卡 +94
缅甸 +95
伊朗 +98
摩洛哥 +212
阿尔及利亚 +213
突尼斯 +216
利比亚 +218
冈比亚 +220
塞内加尔 +221
马里 +223
几内亚 +224
科特迪瓦 +225
布基纳法索 +226
尼日尔 +227
多哥 +228
贝宁 +229
毛里求斯 +230
利比里亚 +231
塞拉利昂 +232
加纳 +233
尼日利亚 +234
乍得 +235
中非共和国 +236
喀麦隆 +237
圣多美和普林西比 +239
加蓬 +241
刚果民主共和国 +243
安哥拉 +244
阿森松岛 +247
塞舌尔 +248
苏丹 +249
埃塞俄比亚 +251
索马里 +252
吉布提 +253
肯尼亚 +254
坦桑尼亚 +255
乌干达 +256
布隆迪 +257
莫桑比克 +258
赞比亚 +260
马达加斯加 +261
津巴布韦 +263
纳米比亚 +264
马拉维 +265
莱索托 +266
博茨瓦纳 +267
斯威士兰 +268
直布罗陀 +350
葡萄牙 +351
卢森堡 +352
爱尔兰 +353
冰岛 +354
阿尔巴尼亚 +355
马耳他 +356
塞浦路斯 +357
芬兰 +358
保加利亚 +359
立陶宛 +370
拉脱维亚 +371
爱沙尼亚 +372
摩尔多瓦 +373
亚美尼亚 +374
白俄罗斯 +375
安道尔共和国 +376
摩纳哥 +377
圣马力诺 +378
乌克兰 +380
斯洛文尼亚 +386
捷克 +420
斯洛伐克 +421
列支敦士登 +423
伯利兹 +501
瓜地马拉 +502
萨尔瓦多 +503
洪都拉斯 +504
尼加拉瓜 +505
哥斯达黎加 +506
巴拿马 +507
海地 +509
玻利维亚 +591
圭亚那 +592
厄瓜多尔 +593
法属圭亚那 +594
巴拉圭 +595
马提尼克 +596
苏里南 +597
乌拉圭 +598
文莱 +673
巴布亚新几内亚 +675
汤加 +676
所罗门群岛 +677
斐济 +679
库克群岛 +682
法属波利尼西亚 +689
柬埔寨 +855
老挝 +856
孟加拉国 +880
马尔代夫 +960
黎巴嫩 +961
约旦 +962
叙利亚 +963
伊拉克 +964
科威特 +965
沙特阿拉伯 +966
也门 +967
阿曼 +968
阿拉伯联合酋长国 +971
以色列 +972
巴林 +973
卡塔尔 +974
蒙古 +976
尼泊尔 +977
塔吉克斯坦 +992
土库曼斯坦 +993
阿塞拜疆 +994
格鲁吉亚 +995
吉尔吉斯斯坦 +996
乌兹别克斯坦 +998
巴哈马 +1242
巴巴多斯 +1246
安圭拉岛 +1264
安提瓜和巴布达 +1268
开曼群岛 +1345
百慕大群岛 +1441
格林纳达 +1473
蒙特塞拉特岛 +1664
关岛 +1671
毛里塔尼亚 +222
圣露西亚 +1758
波多黎各 +1787
多明尼加共和国 +1809
特立尼达和多巴哥 +1868
牙买加 +1876
塞尔维亚共和国 +381

获取验证码

账号密码登录

未注册验证后自动登录，注册/登录则视为同意

《服务协议》和《隐私协议》

未注册验证后自动登录，注册/登录则视为同意

《服务协议》和《隐私协议》

服务协议反馈建议联系邮箱：service@shenlanxueyuan.com

友情链接：

在线咨询

常见问题

证书查询

返回顶部

学习时长

答疑服务

作业批改