强化学习:原理与Python实战在线阅读
会员

强化学习:原理与Python实战

肖智清
开会员,本书免费读 >

计算机网络人工智能17.2万字

更新时间:2023-10-19 17:44:38 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页
  • 会员
    全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强
    肖智清程序设计12.2万字

同类热门书

最新上架

  • 会员
    在人工智能的研究中,既包括对于人类理性思维的模拟,还包括对人类感性思维的计算。本书重点讲述的文本情感分析技术就属于后者。该技术源于自然语言处理领域,但也有别于一般的自然语言处理任务。文本情感分析面向的处理对象是社交媒体中产生的用户评论文本,该文本的特点是带有大量的用户主观情感信息,因此该技术的核心是通过自动分析评论文本来进行情感的理解。文本情感分析技术已有20余年的研究历史,凝聚成了多项研究任务和
    秦兵 赵妍妍 林鸿飞 王素格 徐睿峰计算机23.3万字
  • 会员
    青少年人工智能编程水平测试涵盖从数学逻辑到计算思维、从拖曳程序模块到程序编写、从数学建模到算法设计等多学科知识,能够对学生的多学科知识综合运用能力做出评价;能够通过设计的具体解决方案,对学生的计算思维、创造性思维等能力做出评价;在具体的解决方案中,能够通过设计算法模型和实现算法,对学生掌握和运用编程的能力做出评价。本书结合生活中的实例,系统地介绍了不同进制之间的转换、函数参数的作用域、枚举算法、二
    陈杰编著计算机2万字
  • 会员
    本书由浅入深地介绍了生成式AI的理论与实践,内容涉及从基础原理到前沿应用,为读者提供了一个系统的认知框架。本书从生成式AI技术的基础工具入手,逐步深入到Transformer模型与GPT的原理和应用,详细介绍了图像生成模型StableDiffusion,以及LangChain与AIAgent的相关知识。书中结合开源代码分析,展示了生成式AI在各行各业的实际应用,并探讨了其在高速发展过程中所面临
    欧阳植昊 梁菁菁 吕云翔主编计算机11.7万字
  • 会员
    本书理论联系实际,全面地介绍ChatGPT的主要应用场景,帮助读者掌握ChatGPT的使用方法和技巧。本书不仅讲述了ChatGPT在学习、写作、工作、生活方面的应用案例,还介绍了一个打造个人品牌的综合应用,内容实用,可操作性强。本书适合希望了解ChatGPT的初学者阅读。
    刘韩 王子 潘剑峰编著计算机9.6万字
  • 空间计算是一种不断发展的以三维世界为中心的计算形式和交互形式,是以计算机视觉为基础的高阶应用。其核心是使用AI、计算机视觉和扩展现实将虚拟体验融入物理世界,让用户摆脱屏幕的束缚,自然地与数字世界中的对象互动,就像与真实世界中的对象互动一样。随着生成式AI的爆发,空间计算平台将拥有更加丰富的内容,将在很大程度上改变我们的生活和工作,重新定义商业模式,并改变我们与技术和整个世界互动的方式,推动我们进入
    (美)凯西·哈克尔 伊雷娜·克罗宁计算机12.1万字
  • 会员
    本书由科大讯飞与中国科大的大模型的资深专家联合撰写,一本书打通大模型的技术原理与应用实践壁垒,深入大模型3步工作流程,详解模型微调、对齐优化、提示工程等核心技术及不同场景的微调方案,全流程讲解6个典型场景的应用开发实践。本书共10章,从逻辑上分为“基础知识”“原理与技术”“应用开发实践”三部分。基础知识(第1章)介绍大模型定义、应用现状、存在的问题,以及发展趋势。原理与技术(第2和3章)详细讲解大
    于俊 刘淇 程礼磊 程明月计算机12.3万字
  • 会员
    《PyTorch深度学习与企业级项目实战》立足于具体的企业级项目开发实践,以通俗易懂的方式详细介绍PyTorch深度学习的基础理论以及相关的必要知识,同时以实际动手操作的方式来引导读者入门人工智能深度学习。《PyTorch深度学习与企业级项目实战》共分18章,内容主要包括人工智能、机器学习和深度学习之间的关系,深度学习框架PyTorch2.0的环境搭建,Python数据科学库,深度学习基本原理,
    宋立桓 宋立林计算机10.8万字
  • 会员
    本书着重阐述了深度学习时代的计算机视觉算法的工作原理,首先对深度学习与计算机视觉基础进行了介绍,之后对卷积神经网络结构的演化过程,以及基于深度学习的目标检测算法、图像分割算法、人体姿态估计算法、行人重识别与目标跟踪算法、人脸识别算法以及图像超分辨率重建方法进行了介绍。本书系统讲解了在日常生活和工作中常见的几项计算机视觉任务,并着重介绍了在当今深度学习时代,这些计算机视觉任务是如何工作的,可使读者快
    徐从安 李健伟 董云龙 孙超等计算机9.9万字
  • 会员
    机器学习是计算机科学与人工智能的重要分支领域.本书作为该领域的入门教材,在内容上尽可能涵盖机器学习基础知识的各方面.全书共16章,大致分为3个部分:第1部分(第1~3章)介绍机器学习的基础知识;第2部分(第4~10章)讨论一些经典而常用的机器学习方法(决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习);第3部分(第11~16章)为进阶知识,内容涉及特征选择与稀疏学习、计算
    周志华计算机22.7万字

同类书籍最近更新

  • 会员
    自2009年至今,计算社会学步入了发展的黄金时期。多学科的深度交叉融合,以人工智能为代表的数据科学方法的快速发展以及跨空间、多模态数据的快速富集等都使得计算社会学得到蓬勃发展,让社会科学研究呈现出崭新面貌,为解释人类行为、群体认知、社会演化等提供了重要的理论和方法支撑。本书采用渐进式的组织思路,以人工智能的经典模型为基础理论支撑,从社交网络分析、网络动力学、社交媒体挖掘与社群智能三个维度进行延伸,
    郭斌 梁韵基 於志文人工智能24.6万字
  • 会员
    人工智能的日益广泛的应用和普及,而要深入理解人工智能,我们必须全面理解底层的各类机器学习算法基本原理并能驾驭人工智能各种应用。《人工智能原理与实践》分为13章,前7章为原理篇。原理篇中,我们重点讨论机器学习模型建模的全部流程,各类常用的机器学习算法原理,深度学习和强化学习原理,机器学习涉及的优化论原理,以及机器学习和自然语言处理技术。后面6章为实战篇,我们重点讨论信用卡场景中的客户细分,保险行业中
    刘春雷人工智能15.9万字
  • 会员
    本书主要介绍:XGBoost相关的机器学习基础算法;XGBoost安装编译与简单使用;XGBoost的实现原理与理论证明;XGBoost基于CPU多线程的实现以及分布式训练方法;剖析XGBoost源码,从代码层面洞彻XGBoost的实现原理,以及XGBoost的应用与调优,通过典型示例为读者提供使用参考,掌握实战技能。通过阅读本书,不仅能使读者理解XGBoost的原理,将XGBoost应用到业务场
    何龙人工智能16.2万字
  • 会员
    本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理
    肖智清人工智能17.2万字
  • 会员
    《人工智能技术基础》按照人工智能在不同领域的研究特点,通过专项应用来研究相关技术。全书分为11章,第1章介绍人工智能领域的基本概念,第2章说明Python语言编程工具的使用,第3章到第10章分别从应答机器人、物体识别、人脸识别、语音识别、视频识别、生成对抗神经网络、无人驾驶、区块链和大数据等方面对人工智能从原理到实战一步一步进行介绍,第11章提取了部分人工智能方面的面试题,供未来从事人工智能研究工
    李刚编著人工智能9.7万字
  • 会员
    这本书系统阐述了深度学习方法论在道路短期交通状态时空序列预测领域的最新研究成果。需要着重说明以下几点:1.领域限定在了道路交通,因为交通是个大系统,存在着航空、水运、道路等多种运输方式,而本书所阐述的研究均是针对道路交通领域的数据以及面向道路交通领域的应用;2.本书所讨论的研究问题是道路短期交通状态时空序列预测问题,该问题是时空数据挖掘领域中时空预测问题的一个重要子集,在本书的第1章中将会对这个问
    崔建勋等编著人工智能11.4万字