本书对增强学习与近似动态规划的理论、算法及应用进行了深入研究和论述。主要内容包括:求解Markov链学习预测问题的时域差值学习算法和理论,求解连续空间Markov决策问题的梯度增强学习算法以及进化一梯度混合增强学习算法,基于核的近似动态规划算法,增强学习在移动机器人导航与控制中的应用等。本书是作者在多个国家自然科学基金