深度强化学习 ( DQN )基本原理与AI项目实战

4
回复
1180
查看
[复制链接]
  • TA的每日心情
    擦汗
    2023-5-6 02:41
  • 签到天数: 570 天

    [LV.9]以坛为家II

    2853

    主题

    3456

    帖子

    1万

    积分

    管理员

    Rank: 9Rank: 9Rank: 9

    积分
    17981
    发表于 2018-3-17 14:00:00 | 显示全部楼层 |阅读模式

    登录后查看本帖详细内容!

    您需要 登录 才可以下载或查看,没有帐号?立即注册

    x
    强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。

    在强化学习的世界里, 算法称之为Agent, 它与环境发生交互,Agent从环境中获取状态(state),并决定自己要做出的动作(action).环境会根据自身的逻辑给Agent予以奖励(reward)。奖励有正向和反向之分。比如在游戏中,每击中一个敌人就是正向的奖励,掉血或者游戏结束就是反向的奖励。

    【课程内容】

    强化学习简介
    强化学习基本概念
    马尔科夫决策过程
    Bellman方程
    值迭代求解
    代码实战求解过程
    QLearning基本原理
    QLearning迭代计算实例
    QLearning迭代效果
    求解流程详解
    DeepQnetwork原理
    DQN网络细节
    DQN网络参数配置
    搭建DQN网络模型
    DQN卷积操作定义
    数据预处理
    实验阶段数据存储
    实现训练模块
    Debug解读训练代码
    完整代码流程分析
    DQN效果演示
    下载地址
    游客,如果您要查看本帖隐藏内容请回复




    〖下载地址失效反馈〗:

    下载地址如果失效,请反馈。反馈地址: https://www.fstcode.com/thread-5527-1-1.html

    〖赞助VIP免灵石下载全站资源〗:

    全站资源高清无密,每天更新,VIP特权: https://www.fstcode.com/plugin.php?id=threed_vip

    〖客服24小时咨询〗:

    有任何问题,请点击右侧客服QQ咨询。

    回复

    使用道具 举报

  • TA的每日心情
    开心
    2020-1-12 16:56
  • 签到天数: 1 天

    [LV.1]初来乍到

    0

    主题

    3

    帖子

    13

    积分

    凡人程序员

    Rank: 1

    积分
    13
    发表于 2020-1-12 17:08:10 | 显示全部楼层
    感谢支持
    回复

    使用道具 举报

  • TA的每日心情
    奋斗
    2024-3-11 17:09
  • 签到天数: 130 天

    [LV.7]常住居民III

    1

    主题

    234

    帖子

    1308

    积分

    终身VIP

    Rank: 12Rank: 12Rank: 12

    积分
    1308
    发表于 2022-4-5 23:23:41 | 显示全部楼层
    赞!!!!!!!
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2022-8-13 10:10
  • 签到天数: 1 天

    [LV.1]初来乍到

    0

    主题

    3

    帖子

    23

    积分

    凡人程序员

    Rank: 1

    积分
    23
    发表于 2022-8-13 10:33:43 | 显示全部楼层
    想获取下载地址,谢谢!
    回复

    使用道具 举报

  • TA的每日心情
    郁闷
    2024-8-6 16:35
  • 签到天数: 30 天

    [LV.5]常住居民I

    0

    主题

    83

    帖子

    431

    积分

    终身VIP

    Rank: 12Rank: 12Rank: 12

    积分
    431
    发表于 2024-8-6 16:40:21 | 显示全部楼层
    416+6666666666666666666666666
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

     
    在线客服
    点击这里给我发消息 点击这里给我发消息
    用心服务所有程序员,做最好的编程视频网站
    QQ:354410543
    周一至周日 00:00-24:00
    联系站长:admin@fstcode.com

    QQ群(仅限付费用户)

    Powered by "真全栈程序员" © 2010-2023 "真全栈程序员" 本站资源全部来自互联网及网友分享-如有侵权请发邮件到站长邮箱联系删除!