由北京大学前沿筹备盘问中心助理素养董豪博士等编写的深度强化学习专著《深度强化学习:基础、盘问与应用(Deep Reinforcement Learning: Foundamentals, Research and Applications)》英文版于2020年6月由 Springer 刊行极品成人故事,中语简体、繁体版先后于2021年6月、2022年1月刊行,并于2022年2月对中语简体版敞开免费下载。
内容摘抄
深度强化学习是已毕智能有讨论的要道本事之一,对东说念主工智能、机器东说念主、明白科学、金融、资源调配等紧要应用需乞降盘问所在有要紧的酷爱酷爱。深度学习是基于深度神经汇集的机器学习体式。深度强化学习是强化学习和深度学习的结合体,跟着近几十年来深度学习发展的上升,筹备硬件 GPU、CPU、TPU 等性能快速擢升,深度强化学习手脚一个新的要紧学科分支劝诱了越来越多的科研和产业东说念主员的关注。本书从基本强化学习表面,到深度强化学习算法,再到骨子应用与本质,给读者带来相对全面且实用的深度强化学习学问,便于读者学习和开展盘问使命。
本书分为三大部分,掩饰了学习深度强化学习所需的悉数内容。第一部分先容了强化学习的基础学问、常用的深度强化学习算法过火已毕体式。第二部分对精选的深度强化学习盘问所在张开先容,这对但愿开展规划盘问的读者极度挑升念念酷爱。为了匡助读者愈加深入地同一深度强化学习细节并把规划本事应用到骨子中,本书第三部分仔细地说明了大宗应用的已毕细节,举例机器东说念主学习跑步、机械臂截止、下围棋、多智能体平台等等,并提供规划的开源代码。
本书不错手脚在深度强化学习规划范畴使命的磨真金不怕火、学生或工程师的阅读材料和参考书。一方面不错匡助读者从零运转学习强化学习,到深入具体的盘问所在;另一方面不错匡助读者快速地把深度强化学习本事用于骨子神色中。配合本书的开源代码,匡助读者充分利用好 CPU 和 GPU 等筹备资源,擢升深度强化学习实验效果,加深对盘问应用项筹划同一,鼓励通盘东说念主智能范畴的发展。
反差 匿名咸鱼
大师推选
郭毅可
帝国理工学院素养、数据科学盘问所首创长处
香港浸会大学副校长
英国皇家工程院院士,欧洲科学院院士
我对这本书掩饰内容的范围之广印象深远。从深度强化学习的基础表面学问,到包含代码细节的本事已毕描述,作家们花了大宗的元气心灵勇猛于提供抽象且鄙俚的内容。这种格调的竹素是对入门者和科研东说念主员绝佳的学习材料。拥抱开源社区是深度学习得到快速发展不行或缺的一个原因。我很沸腾这本书提供了大宗的开源代码。我也确信这本书将会对那些但愿深入这个范畴的盘问东说念主员极度有效,也对那些但愿通过开源例子快速上手的工程师提供邃密的基础。
陈宝权
北京大学博雅特聘素养
前沿筹备盘问中心施行主任
IEEE Fellow
这本书提供了可靠的深度强化学习内容先容,减轻基础表面和本质之间的差距,以提供肃穆的描述和算法已毕为特质,提供大宗技能和速查表。作家们由盘问强化学习的顶级大学盘问者和将本事用在种种应用中的开源社区本质者构成。这本书为有着不同配景和阅读筹划的读者提供了极度有效的资源。
金 驰
普林斯顿大学助理素养
这是一册对于深度强化学习这个要紧范畴的应时的竹素。这本书以一种简明了了的格调提供了肃穆的器用:包括深度强化学习的基础和要紧算法,具体已毕细节,和对盘问所在的前瞻。这本书对任何平稳学习深度强化学习、将深度强化学习算法讹诈到某些应用上或运转进行深度强化学习基础盘问的东说念主来说王人是很遐想的学习材料。
李克之
伦敦大学学院助理素养
这本书是为强化学习、超过是深度强化学习的诚恳粉丝提供的。从2013年运转,深度强化学习已经渐渐地以多种时势调动了咱们活命和寰球,比如自动驾驶本事、会棋战的 AlphaGo 本事的出现。它展示对“围棋之好意思”跳跃专科选手的同一才智。访佛的情况也发生在本事、医疗和金融范畴。深度强化学习探索了一个东说念主类最基本的问题:东说念主类是若何通过与环境交互进行学习的?这个机制可能成为逃出“大数据罗网”的要道身分,手脚一条强东说念主工智能的必经之路,通向莫得东说念主类贤达所企及的地方。
这本书由一群对机器学习充满关爱的年青盘问东说念主员编辑,它将给你展示深度强化学习的寰球,通过实例和劝诫先容加深你的同一。推选此书给悉数想把将来贤达之匙揣入口袋的学习者。
作家团队
本书作家团队一齐为一线科研东说念主员和开源社区成员,使用深度强化学习科罚不同范畴的问题。本书内容减轻了表面和本质之间的距离,提供了大宗工程已毕的细节和技能。团队的种种性使得本书格调对不同范畴的读者更为友好,并对代码库进行维持和保重。
编者团队
董豪,北京大学筹备机学院、前沿筹备盘问中心助理素养,博士生导师。于2019年秋赢得英国帝国理工学院博士学位。盘问所在主要波及筹备机视觉和机器东说念主,筹划是裁减学习智能系统所需要的数据,已毕自主学习。他勇猛于推行东说念主工智能本事,是深度学习开源框架 TensorLayer 的首创东说念主,并赢得 ACM MM 2017年度最好开源软件奖。他在英国帝国理工和英国中央兰开夏大学赢得一等盘问生和一等本科学位。
丁子涵,普林斯顿大学博士。于2019年赢得英国帝国理工学院硕士学位,曾在加拿大 Borealis AI、腾讯 Robotics X 实验室有过使命资格。本科就读中国科学本事大学,获物理和筹备机双学位。盘问所在主要波及强化学习、机器东说念主截止、筹备机视觉等。在 ICRA, IROS, NeurIPS, AAAI, IJCAI, Physical Review 等顶级期刊与会议发表多篇论文,是 TensorLayer-RLzoo、TensorLet 和 Arena 等开源代码库的孝顺者。
仉尚航,北京大学筹备机学院助理素养,博士生导师。于2018年博士毕业于好意思国卡内基梅隆大学,后于2020年加入加州大学伯克利分校 BAIR 实验室任博士后盘问员。盘问所在主要为敞开环境泛化机器学习表面与系统,同期在筹备机视觉和强化学习所在领有丰富盘问劝诫。在东说念主工智能顶级期刊会通议上发表论文30余篇,并恳求5项好意思中专利。获 AAAI'21最好论文奖,好意思国2018年度“EECS Rising Star”,Adobe 学术勾搭基金,Qualcomm 立异奖提名等。
作家访谈
问:为什么写这本书?
答:咱们写这本书的初志是因为市面上很少有竹素或者教程能同期掩饰从“0到1”和“从1到N”的深度强化学习内容,学习材料极度零碎。因此,咱们但愿大约用一套同一的标记和代码,来素养深度强化学习,让学生能快速地对通盘范畴有了了的系统性明白。
问:写这本书最大的得益是什么?
答:写这本书对咱们来说有两方面的得益。一方面,已毕了咱们学问传播的初志。另一方面,对咱们作家团队来说,咱们互相学习了许多学问。
问:为什么先有英文版,背面又翻译成中语呢?
答:因为强化学习范畴比拟前沿的内容王人是英文的,为了约略编写,起初成书是英文版块。自后反响邃密,纸质版和电子版销售量王人很大,电子版块下载量已经跳跃了8万册。咱们也建立了读者雷同群,许多读者王人默示但愿能有中语版块。因此,咱们把书翻译成了中语,并决定把这本书的中语版块免费开源出来,但愿不错更好地匡助全球学习。
问:据说还出了繁体版块?
答:是的。由于中语简体版比拟受接待,有港台地区同学反应但愿能有繁体字版块,于是出书社翻译了繁体字版块,现已在线发售。为了适当当地同学阅读俗例,繁体字版块的部分用词语句王人作念了一些退换,包括书的题目也有所转换,愈加适应当地同学阅读俗例。
问:写稿中碰到的最大艰辛是什么?
写这本书的使命量是广泛的,作家们的使命和学习王人很忙,王人是兼职写这本书,况且还有好几个配套的代码库,大约按缱绻完成已经挺阻遏易了。因此,咱们探索并招揽了开源的模式来写稿,不外前后也消耗了一年多的时分。
好音书
《深度强化学习》的英文版竹素于2020年6月由 Springer 出书社刊行,电子版已在 Springer 官网下载8.3万余次。中语简体版于2021年6月由电子工业出书社刊行,初版还是刊行已售罄,现刊行第二版。同期于2022年1月针对港台地区推出中语繁体版。2022年2月,中语简体版竹素敞开免费下载。
中英文版块购书集合、下载集合请见竹素主页:https://deepreinforcementlearningbook.org/
有问题接待规划作家团队极品成人故事,团队会实时回话。