会员
强化学习:原理与Python实战
肖智清更新时间:2023-10-19 17:44:38
最新章节:封底开会员,本书免费读 >
本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
强化学习:原理与Python实战最新章节
查看全部- 封底
- 作者简介
- 16.8 练习与模拟面试
- 16.7 本章小结
- 16.6 案例:老虎
- 16.5 部分可观测Markov决策过程
- 16.4 半Markov决策过程
- 16.3 非齐次Markov决策过程
- 16.2 连续时间Markov决策过程
- 16.1 平均奖励离散时间Markov决策过程
肖智清
主页
同类热门书
最新上架
- 会员
文心一言:人人都能上手的AI工具
本书作为文心一言的学习指南,全面、细致地介绍了文心一言PC端和App的各项功能和使用方法,力求通过简洁明了的语言和图文并茂的形式,让读者快速掌握文心一言的各项功能。全书共8章,首先简单介绍了人工智能发展的几个阶段及文心一言的相关研发背景;随后介绍了文心一言的基础页面及功能等内容,以及文心一言在学习、工作、生活娱乐方面的应用及相关案例;接着介绍了文心一言的插件,以及文心一言App的功能和使用技巧;最计算机10.7万字 - 会员
ChatGPT漫谈
本书深度探讨了构建和训练ChatGPT模型涉及的核心技术,以及ChatGPT在各种实际应用中的作用。全书精心划分为三部分,其中第1章为第1部分,第2章为第2部分,第3章和第4章为第3部分。首先,详细阐述了机器学习的历史演变与各种学习范式,同时也揭示了在人工智能生成内容(AIGC)领域下,图像处理和自然语言处理技术的历史发展趋势;接下来,对ChatGPT的运行机制和关键算法进行深度解析,包括大规模模计算机10.8万字 - 会员
智能计算系统:从深度学习到大模型
本书由中科院计算所、软件所的专家学者倾心写就,以“图像风格迁移”应用为例,全面介绍智能计算系统的软硬件技术栈。第2版以大模型为牵引进行更新,第1章回顾人工智能、智能计算系统的发展历程,第2、3章在介绍深度学习算法知识的基础上增加了大模型算法的相关知识,第4章介绍深度学习编程框架PyTorch的发展历程、基本概念、编程模型和使用方法,第5章介绍编程框架的工作原理,第6章回顾深度学习所用的处理器结构从计算机34.9万字 - 会员
机器学习中的统计思维(Python实现)
机器学习是人工智能的核心,而统计思维则是机器学习方法的核心:从随机性中寻找规律性。例如,利用损失最小化思想制定学习策略,采用概率最大化思想估计模型参数,利用方差对不确定性的捕捉构造k维树,采用贝叶斯公式构建分类决策模型,等等。只有树立正确的统计思维,才能准确高效地运用机器学习方法开展数据处理与分析。本书以统计思维的视角,揭示监督学习中回归和分类模型的核心思想,帮助读者构建理论体系。计算机18万字 - 会员
一本书读懂大模型:技术创新、商业应用与产业变革
这是一本人人都能读懂的大模型综合指南,既是一本大模型的科普书,又是一本大模型的商业书。由中国电信研究院天翼智库官方出版,从核心技术、基础设施、商业应用、产业体系、安全治理5个维度全面讲解了大模型。语言上通俗易懂,内容上深入浅出,呈现上图文并茂,给读者良好阅读体验的同时,让读者对大模型的理解事半功倍!无论你是AI工程师,还是完全没有IT技术背景的爱好者;无论你是一线的从业人员,还是企业的管理者和决策计算机13.2万字 - 会员
玩赚ChatGPT:人人都能用的工作好帮手
本书以工作场景和具体任务来驱动,包括53个场景展示、85项任务模拟、237次提问示范,让完全不懂技术的小白,也能成为ChatGPT工具使用方面的行家。本书通过详细讲解具体任务的提问与追问方法,让ChatGPT成为每个人的工作好帮手,帮助人们提升工作效能,打造超能个体与超能团队。计算机13.8万字 - 会员
PyTorch深度学习应用实战
《PyTorch深度学习应用实战》以统计学/数学为出发点,介绍深度学习必备的数理基础,讲解PyTorch的主体架构及最新的模块功能,包括常见算法与相关套件的使用方法,例如对象侦测、生成对抗网络、深度伪造、图像中的文字辨识、脸部辨识、BERT/Transformer、聊天机器人、强化学习、自动语音识别、知识图谱等。本书配有大量案例及图表说明,同时以程序设计取代定理证明,缩短学习过程,增加学习乐趣。计算机15.2万字 - 会员
ChatGPT大模型:技术场景与商业应用
ChatGPT作为人工智能领域的一大进步,引起了热议,其强大功能的背后离不开大模型的支持。大模型指的是参数规模超过千万的机器学习模型,主要应用于语音识别、计算机视觉等领域。本书聚焦大模型,对大模型的技术场景和商业应用展开详细叙述。本书主要从典型应用ChatGPT入手,探寻其背后支撑大模型的魅力。首先,本书对大模型的基础概念、产业格局、带来的新型商业模式进行讲解,展现了大模型的发展现状和商业化潜力。计算机13.2万字 - 会员
GPT图解:大模型是怎样构建的
人工智能(AI),尤其是生成式语言模型和生成式人工智能(AIGC)模型,正以惊人的速度改变着我们的世界。驾驭这股潮流的关键,莫过于探究自然语言处理(NLP)技术的深奥秘境。本书将带领读者踏上一段扣人心弦的探索之旅,让其亲身感受,并动手搭建语言模型。本书主要内容包括N-Gram,词袋模型(BoW),Word2Vec(W2V),神经概率语言模型(NPLM),循环神经网络(RNN),Seq2Seq(S2计算机14万字