登录
首页 » python » 强化学习教程代码

强化学习教程代码

于 2022-03-15 发布 文件大小:247.06 kB
0 206
下载积分: 2 下载次数: 3

代码说明:

强化学习基本教程,包括A3C,DDPG等 有小车、机器臂等基本游戏的控制 强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,强化学习不同于连接主义学习中的监督学习,主要表现在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • VAE
    神经网络VAE实现详细代码,希望对初学者有帮助哦!(Neural network VAE to achieve detailed code, hope to help beginners oh!)
    2019-02-27 18:57:10下载
    积分:1
  • 线性回归
    说明:  能够实现线性回归,里面有一个线性回归的实例(It can realize linear regression. There is an example of linear regression)
    2020-05-10 09:38:06下载
    积分:1
  • segment
    说明:  应用:森林应用单木分割python代码下载,算法下载,处理点云数据进行单木分割。(orest application single wood segmentation Python code download, algorithm download, processing point cloud data single wood segmentation.)
    2020-05-24 21:10:41下载
    积分:1
  • 利用隐马尔科夫过程分析股票
    利用hmmlearn的 GMMHMM,GaussianHMM对金融序列进行隐马尔科夫过程分析!
    2023-04-18 21:15:03下载
    积分:1
  • fourier2020.11.30
    说明:  测井曲线的傅立叶变换,import pandas as pd import matplotlib.pyplot as plt import myfuntion as mf import pylab as py from matplotlib.font_manager import FontProperties(import pandas as pd import matplotlib.pyplot as plt import myfuntion as mf import pylab as py from matplotlib.font_manager import FontProperties)
    2020-12-14 17:12:49下载
    积分:1
  • CNN -- 基于tensorflow的LeNet-5实现
     1. eclipse上的python项目  2. 基于tensorflow,实现了LeNet-5网络模型,包括对MNIST数据集的预处理、模型搭建和对模型的训练、验证
    2020-11-30下载
    积分:1
  • 人脸识别门禁系统
    该项目为基于python和opencv的人脸识别门禁系统,用了opencv的lbph算法,达到百分之七十以上的相似度才可认为是识别成功
    2022-04-15 08:55:09下载
    积分:1
  • 小波神经网络的时间序列预测代码
    说明:  小波神经网络的时间序列预测代码小波神经网络是结合 小波变换理论与人工神经网络的思想而构造的一种新的 神经网络模型,它结合了小波变换良好的时频局域化性质及神经网络的自学习功能,(Time series prediction code of wavelet neural networ Time series prediction using wavelet process neural network For example, Ding and Zhong used a wavelet process neural network to solve time series prediction problems)
    2021-02-08 10:21:41下载
    积分:1
  • Python_LZB_Test_upload
    说明:  Python 图像处理机器学习入门开源代码,代码仅供学习使用!(Python Image Processing Machine Learning Initial Open Source Code, Code for learning only!)
    2019-02-28 09:07:55下载
    积分:1
  • 图像识别(基于百度api)
    【实例简介】 # client_id 为官网获取的AK, client_secret 需要从百度官方申请SK
    2021-05-31 00:31:11下载
    积分:1
  • 696516资源总数
  • 106914会员总数
  • 0今日下载