媒体评论 We are most pleased that Professor Kai Yu has produced this Chinese translation of our textbook, which we hope will enable more Chinese students to self-study reinforcement learning and lead to the development of new ideas within China that contribute to the diversity and vigour of worldwide reinforcement learning research. ——Richard Sutton and Andrew Barto
记得在2018年的IJCAI大会上, 我作为国际人工智能联合会的理事会给 Andrew Barto 教授颁发2018年杰出研究贡献奖(Research Excellence Award 。这个奖每年颁发给一位长期在人工智能界探索并做出杰出贡献的科学家。我当时问Barto教授,看到现在AlphaGo和AlphaZero凭强化学习横扫围棋界,有什么感受? 他说,一直到现在退休,强化学习都是小众研究领域。现在虽然已退休,但赶上AlphaGo/AlphaZero的成功,还是很感慨的! 在人工智能界,Richard Sutton(Barto的学生)和 Andrew Barto 是的强化学习的鼻祖,是他们师徒把强化学习作为一个机器学习的重要分支,搬上大雅之堂。这部《强化学习》(第2版)也凝聚了他们的心血。如文中所述,强化学习模拟人类学习的策略,利用积累的经验来改进决策系统的性能,就像国际象棋大师的走子一样,其是通过反复考虑对手可能的反应而进行多步的判断来给出的。这些观察通过用数学,是概率论对智能体、对手和环境进行简练的表达,可以解释如何通过不断的训练,逐步提高智能体的能力。 全书对读者的机器学习背景没有做太多的假设,从头娓娓道来,不仅把强化学习重要的理念讲得极为清晰,而且细致回顾了一些强化学习背后的科学家的小故事,生动活泼。同时,书中也不时地指出脑科学的新发现对强化学
以下为对购买帮助不大的评价