强化学习:原理与Python实战在线阅读
会员

强化学习:原理与Python实战

肖智清
开会员,本书免费读 >

计算机网络人工智能17.2万字

更新时间:2023-10-19 17:44:38 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页

最新上架

  • 会员
    本书从技术和规制两个角度入手,以人工智能治理的法律、公共政策以及伦理规范等相关社会行为和社会关系的规则建立和运行为主要思考方向和研究进路,在梳理人工智能发展情况、欧盟及其他国家人工智能立法与政策发布现状的基础上,对人工智能治理的基础、基本路径及我国人工智能产业、政策与规制思路进行了全面和有益的探索。
    杨晓雷主编计算机23.9万字
  • 会员
    本书系统地探讨了人工智能对法律行业的深远影响、法律人应该掌握的AI知识以及相关的法律AI工具。本书共14章,分为五部分。第一部分(第1章)介绍了大模型的基础知识以及AI在法律领域的应用趋势和场景,并深入探讨了AI对法律行业带来的影响等。第二部分(第2~6章)针对法律人的主要工作任务,包括类案检索、案情分析、法律咨询、法律文书写作、合同审查等,详细讲解了应该如何使用AI来提升工作效率。第三部分(第7
    张萌 李小武 兰洋 陈中泽等计算机23.8万字
  • 会员
    本书共九章,分别介绍AI写作工具、AI优化简历、职场入门AI写作、AI项目策划、AI项目复盘、AI高效办公、AI高效沟通、让职场更轻松的软件和AI职场视频剪辑等内容。
    刘丙润编著计算机10.1万字
  • 会员
    本书分为23章,从基础的演讲知识入手,到演讲稿的写作技巧,再到指导读者如何有效地利用ChatGPT进行演讲稿写作和演讲练习,最后通过实际的行业案例进行深入的学习和实战应用。使读者不仅可以学习演讲的相关知识,还能对如何利用ChatGPT进行有效的演讲有所理解。
    刘萌雪 赵建涛 屈高翔计算机19.1万字
  • 会员
    《秒懂AI写作:让你轻松成为写作高手》针对职场、学习、生活、艺术创作领域常见的40余种写作应用场景,遵循“场景+方法+总结”的框架,详细介绍了如何正确利用AI完成多种写作任务,并归纳出使用AI写作的方法和技巧。《秒懂AI写作:让你轻松成为写作高手》分为6章。第1章通过5个步骤、6大场景介绍了如何驾驭AI完成多种类型的写作任务;第2章至第6章分别详细介绍了在职场应用文写作、商业营销文案写作、新媒体写
    秋叶 刘进新 贾凝墨 万静计算机8.1万字
  • 会员
    本书主要从软件开发者的角度探讨如何构建和设计深度学习系统。作者首先描述一个典型的深度学习系统的整体,包括其主要组件以及它们之间的连接方式,然后在各个单独的章节中深入探讨这些主要组件。对于具体介绍的章节,会在开始时讨论需求,接着介绍设计原则和示例服务/代码,并评估开源解决方案。通过阅读本书,读者将能够了解深度学习系统的工作原理,以及如何开发每个组件。本书的主要读者对象是想要从事深度学习平台工作或将一
    (美)王迟 (美)司徒杰鹏计算机18.1万字
  • 会员
    本书共分为10章。第1章介绍短视频文案与AIGC;第2章为AIGC工具助力文案选题策划;第3章为短视频标题撰写与优化;第4章为短视频脚本与情节设计;第5章为短视频带货文案写作;第6章为评论区互动文案写作;第7章为段子文案写作;第8章为短视频内容标签化;第9章为短视频营销文案写作;第10章为短视频与AI的有机结合。
    邵诗雨编著计算机8.8万字
  • 会员
    DeepSeek是一种基于Transformer架构的生成式AI(ArtificialIntelligence)大模型,融合了MoE架构、混合精度训练、分布式优化等先进技术,具备强大的文本生成、多模态处理和任务定制化能力。本书系统性地介绍了开源大模型DeepSeek-V3的核心技术及其在实际开发中的深度应用。全书分三部分共12章,涵盖理论解析、技术实现和应用实践。本书通过深度讲解与实用案例相结合
    未来智能实验室 代晶编著计算机17.1万字
  • 这是一本探讨人工智能与生物技术的融合颠覆传统医疗,并会对未来药物研发产生重大影响的书。作者凭借其在生物科学方面的专业背景,以及在生物技术和制药行业的从业经验,为读者呈现了对于医疗科技这一前沿领域的深刻见解。书中首先概述了数据科学方法的兴起以及生物学领域的范式转变,这一转变催生了计算生物学的革命,即通过计算机模拟进行生物实验和药物研发。作者详细介绍了人工智能和深度学习领域的重大突破,并探讨了这些技术
    (美)布赖恩·希尔布什计算机18.6万字