
会员
强化学习:原理与Python实现
更新时间:2019-10-11 15:10:40 最新章节:12.3 本章小结
书籍简介
全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强化学习算法,结合TensorFlow实现源码。第三部分介绍强化学习综合应用案例。
品牌:机械工业出版社
上架时间:2019-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
肖智清
- 会员本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理人工智能17.2万字
同类热门书
最新上架
同类书籍最近更新
- 会员本书从网络工程师的视角出发,详细讲解了Python在网络运维自动化中的应用,其中涉及Python网络运维自动化的相关技术、工具以及实践。本书共10章,先对Python网络运维自动化进行了全面的概述,然后讲解了网络工程师所需的Python基础、数据格式与数据建模语言的相关知识。接着,本书介绍了网络配置的结构化数据提取、网络配置的模块化管理、Netmiko详解与实践、模型驱动的新网络管理方式及实践、网程序设计13.3万字
- 会员本书全面深入地介绍Elasticsearch的核心功能及其工作机制。本书由浅入深,从Elasticsearch的基本用法和架构原理,以及倒排索引、分片、节点角色和相关性等核心概念讲起;然后深入探讨数据处理和索引管理,涵盖映射模式、数据类型、文本分析、索引模板;接着详细介绍词项级搜索、全文搜索、复合查询和高级搜索等Elasticsearch的搜索功能,并深入讲解聚合;最后聚焦生产环境中的Elasti程序设计27.5万字