强化学习：原理与Python实战最新章节全文无弹窗在线阅读-QQ阅读女生中文青春网

QQ阅读中文短篇网

中文短篇网

达人推广书架浏览历史

登录 | 注册

书籍简介

本书从原理和实战两个方面介绍了强化学习。原理方面，深入介绍了主流强化学习理论和算法，覆盖资格迹等经典算法和MuZero等深度强化学习算法；实战方面，每章都配套了编程案例，以方便读者学习。全书从逻辑上分为三部分。第1章：从零开始介绍强化学习的背景知识，介绍环境库Gym的使用。第2～15章：基于折扣奖励离散时间Markov决策过程模型，介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论，进而在理论的基础上讲解算法，并为算法提供配套代码实现。基础理论的讲解突出主干部分，算法讲解全面覆盖主流的强化学习算法，包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应，还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章：介绍其他强化学习模型，包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等，以便更好了解强化学习研究的全貌。

品牌：机械工业出版社

上架时间：2023-08-01 00:00:00

出版社：机械工业出版社

本书数字版权由机械工业出版社提供，并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清

最新上架

会员
人工智能治理研究
本书从技术和规制两个角度入手，以人工智能治理的法律、公共政策以及伦理规范等相关社会行为和社会关系的规则建立和运行为主要思考方向和研究进路，在梳理人工智能发展情况、欧盟及其他国家人工智能立法与政策发布现状的基础上，对人工智能治理的基础、基本路径及我国人工智能产业、政策与规制思路进行了全面和有益的探索。
杨晓雷主编计算机23.9万字
会员
法律人AI指南：大模型10倍提升工作效率的方法与技巧
本书系统地探讨了人工智能对法律行业的深远影响、法律人应该掌握的AI知识以及相关的法律AI工具。本书共14章，分为五部分。第一部分（第1章）介绍了大模型的基础知识以及AI在法律领域的应用趋势和场景，并深入探讨了AI对法律行业带来的影响等。第二部分（第2~6章）针对法律人的主要工作任务，包括类案检索、案情分析、法律咨询、法律文书写作、合同审查等，详细讲解了应该如何使用AI来提升工作效率。第三部分（第7
张萌李小武兰洋陈中泽等计算机23.8万字
会员
AI高效工作一本通
本书共九章，分别介绍AI写作工具、AI优化简历、职场入门AI写作、AI项目策划、AI项目复盘、AI高效办公、AI高效沟通、让职场更轻松的软件和AI职场视频剪辑等内容。
刘丙润编著计算机10.1万字
会员
巧用ChatGPT轻松学演讲
本书分为23章，从基础的演讲知识入手，到演讲稿的写作技巧，再到指导读者如何有效地利用ChatGPT进行演讲稿写作和演讲练习，最后通过实际的行业案例进行深入的学习和实战应用。使读者不仅可以学习演讲的相关知识，还能对如何利用ChatGPT进行有效的演讲有所理解。
刘萌雪赵建涛屈高翔计算机19.1万字
会员
秒懂AI写作：让你轻松成为写作高手
《秒懂AI写作：让你轻松成为写作高手》针对职场、学习、生活、艺术创作领域常见的40余种写作应用场景，遵循“场景+方法+总结”的框架，详细介绍了如何正确利用AI完成多种写作任务，并归纳出使用AI写作的方法和技巧。《秒懂AI写作：让你轻松成为写作高手》分为6章。第1章通过5个步骤、6大场景介绍了如何驾驭AI完成多种类型的写作任务；第2章至第6章分别详细介绍了在职场应用文写作、商业营销文案写作、新媒体写
秋叶刘进新贾凝墨万静计算机8.1万字
会员
设计深度学习系统
本书主要从软件开发者的角度探讨如何构建和设计深度学习系统。作者首先描述一个典型的深度学习系统的整体，包括其主要组件以及它们之间的连接方式，然后在各个单独的章节中深入探讨这些主要组件。对于具体介绍的章节，会在开始时讨论需求，接着介绍设计原则和示例服务/代码，并评估开源解决方案。通过阅读本书，读者将能够了解深度学习系统的工作原理，以及如何开发每个组件。本书的主要读者对象是想要从事深度学习平台工作或将一
(美)王迟 (美)司徒杰鹏计算机18.1万字
会员
AI短视频文案写作从入门到精通
本书共分为10章。第1章介绍短视频文案与AIGC；第2章为AIGC工具助力文案选题策划；第3章为短视频标题撰写与优化；第4章为短视频脚本与情节设计；第5章为短视频带货文案写作；第6章为评论区互动文案写作；第7章为段子文案写作；第8章为短视频内容标签化；第9章为短视频营销文案写作；第10章为短视频与AI的有机结合。
邵诗雨编著计算机8.8万字
会员
DeepSeek原理与项目实战：大模型部署、微调与应用开发
DeepSeek是一种基于Transformer架构的生成式AI（ArtificialIntelligence）大模型，融合了MoE架构、混合精度训练、分布式优化等先进技术，具备强大的文本生成、多模态处理和任务定制化能力。本书系统性地介绍了开源大模型DeepSeek-V3的核心技术及其在实际开发中的深度应用。全书分三部分共12章，涵盖理论解析、技术实现和应用实践。本书通过深度讲解与实用案例相结合
未来智能实验室代晶编著计算机17.1万字
人工智能与计算生物的未来
这是一本探讨人工智能与生物技术的融合颠覆传统医疗，并会对未来药物研发产生重大影响的书。作者凭借其在生物科学方面的专业背景，以及在生物技术和制药行业的从业经验，为读者呈现了对于医疗科技这一前沿领域的深刻见解。书中首先概述了数据科学方法的兴起以及生物学领域的范式转变，这一转变催生了计算生物学的革命，即通过计算机模拟进行生物实验和药物研发。作者详细介绍了人工智能和深度学习领域的重大突破，并探讨了这些技术
(美)布赖恩·希尔布什计算机18.6万字

关于腾讯About Tencent服务协议开放平台广告服务腾讯招聘腾讯公益客服中心违规举报

达人推广合作：https://kol.yuewen.com

网站合作：傅女士 fuli.a@yuewen.com

双新用户（设备和账号都新为双新用户）下载并登录后1-20天最多可免费领取20本会员/单订书且可免费读10天

Copyright (C) 2025 apad.qq.com All Rights Reserved 上海阅文信息技术有限公司版权所有
粤公网安备 44030002000001号增值电信业务经营许可证：粤B2-20090059 互联网ICP备案号：粤B2-20090059-5 沪ICP备14016804号-3 举报电话：010-59357051 营业执照
网络文化经营许可证：沪网文 (2023) 3296-228号网络出版服务许可证：（署）网出证（沪）字第055号互联网宗教信息服务许可证：沪（2023）0000015