登录
首页 » c » 增强学习算法

增强学习算法

于 2022-08-10 发布 文件大小:1.45 kB
0 106
下载积分: 2 下载次数: 1

代码说明:

马尔卡夫决策过程理论定义了一个数学模型,可用于随机动态系统的最优决策过程。强化学习利用这个数学模型将一个现实中的问题变成一个数学问题。强化学习的故事1:找到最优价值强化学习就是:追求最大回报G追求最大回报G就是:找到最优的策略π∗。策略π∗告诉在状态s,应该执行什么行动a。最优策略可以由最优价值方法v∗(s)或者q∗(s,a)决定

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • SPI+OLED显示屏用户资料
    说明:  oled程序,包含51,stm32。m430。arduio,等(OLED program, including 51, stm32. M430. Arduio, etc.)
    2019-05-08 23:47:24下载
    积分:1
  • 题三:超声速静压探针设计程序
    说明:  超声速静压探针程序,采用有旋特征线法求解旋成体绕流流场,能给出任意马赫数下的壁面沿程压力分布情况,给出壁面静压恢复到自由来流静压的位置;(Supersonic hydrostatic probe program)
    2020-06-23 11:40:02下载
    积分:1
  • 算术,哥伦布,在 c + + 中的 expgolomb 执行
    指数哥伦布码表示整数使用变得更长更大数字的位模式
    2022-03-25 11:24:58下载
    积分:1
  • UDP-Tunnel
    UDB TUNNEL C++ bot for windows
    2013-05-04 16:34:49下载
    积分:1
  • yinhangmoni
    这是一个简单的银行模拟系统 1、 客户的到达时间随机 2、 客户需要处理的业务随机(不同业务处理的平均长度不同,例如:取款时间较短,开户和销户时间较长) 3、 处理客户业务所需时间随机(在一定范围内) 4、 使用文本文件记录每个客户到达时间、业务处理时间、业务结束时间 5、 动态显示(刷新时间可调)目前每个窗口累计处理客户数量、等待人数,每个窗口的平均业务处理时间,不同业务类型业务的累计办理量。 (This is a simple bank simulation system 1 customer arrival time random 2, customers need to deal with the business of random (the average length of the different business processes, such as: the withdrawal shorter, longer to open an account and cancel the account) 3, the time required to deal with customer service random (within certain limits) 4, using a text file to record each customer arrival time, business processing time, the business end of time 5 dynamically display (refresh time is adjustable) each window is accumulated to handle the number of customers waiting for the number the average business processing time of each window, different type of business operations total for the amount.)
    2012-11-22 00:08:18下载
    积分:1
  • DotNetZipLib-DevKit-v1.9
    说明:  zip extends in .net framework. using c#
    2019-02-02 14:58:54下载
    积分:1
  • menu
    真正实现完美应用的以LCD12864为显示终端的四行多级菜单源码(完整版),绝非某些人发那个毫无帮助的骗点数的PDF文档!压缩包中只包含了3个.h及2个.c文件,请自己在Keil下新建工程并加入相应文件(Real applications in order to achieve the perfect LCD12864 display terminals for multi-level menu of the four lines of source code (full version), not some fat that will not help deceive the PDF document points! Compression package contains only three. H and 2. C file, Keil under their new construction and add the corresponding file)
    2020-10-02 10:57:48下载
    积分:1
  • No6a
    Matlab教学课程实例资料,仅供教学参考。(Matlab tutorial instance data, teaching and reference purposes only.)
    2011-01-17 11:15:26下载
    积分:1
  • Canny算子提取边缘
    图像边缘特征提取,用Canny算子提取边缘,进行识别
    2022-07-08 01:23:56下载
    积分:1
  • Chapter14-MD2-Animation
    计算机图形学课程设计实例源码14 opengl基础内容,很实用(Computer graphics curriculum design example source 14 opengl based content, it is practical)
    2013-10-20 18:18:45下载
    积分:1
  • 696516资源总数
  • 106914会员总数
  • 0今日下载