暂无商品咨询信息 [发表商品咨询]
本书的目的是考虑大型且具有挑战性的多阶段决策问题,这些问题原则上可以通过动态规划和**控制来解决,但它们的准确解决方案在计算上是难以处理的。本书讨论依赖于近似的解决方法,以产生具有足够性能的次优策略。这些方法统称为增强学习,也可以叫做近似动态规划和神经动态规划等。 本书的主题产生于**控制和人工智能思想的相互作用。本书的目的之一是探索这两个领域之间的共同边界,并架设一座具有任一领域背景的专业人士都可以访问的桥梁。
基本信息 | |
---|---|
出版社 | 清华大学出版社 |
ISBN | 9787302656449 |
条码 | 9787302656449 |
编者 | [美]德梅萃·P. 博塞克斯(Dimitri P. Bertsekas) 著 李宇超 译 |
译者 | 李宇超 |
出版年月 | 2024-04-01 00:00:00.0 |
开本 | 其他 |
装帧 | 平装 |
页数 | 0 |
字数 | |
版次 | 1 |
印次 | 1 |
纸张 | 一般胶版纸 |
暂无商品评论信息 [发表商品评论]
暂无商品咨询信息 [发表商品咨询]