课堂笔记
该分类下共有 54 篇文章
返回所有文章 →模拟退火算法
模拟退火 (simulated annealing) 算法是一种用于求解最优化问题的随机化算法。它的灵感来源于物理退火过程的启发,通过模拟固体加温、等温、冷却等过程,结合 Metropolis 采样准则进行科学计算的一种启发式算法。模拟退火算法在解决组合优化问题、函数优化问题等方面表现出色,尤其适用于大规模复杂问题的求解。
2763 个字词
|
14 分钟
强化学习 Chapter 1 - 基本定义和基础概念
Markov决策过程(MDP)是强化学习的基础模型,是一种通过与环境交互从而学习一个策略,实现最大化累积奖励的理论框架。MDP的数学模型由状态空间、动作空间、转移概率和奖励函数组成。时至今日,MDP已经成为强化学习的标准模型,被广泛应用于各个领域,包括机器人控制、游戏AI和自动驾驶等。
3746 个字词
|
19 分钟
机器人学基础 第一章 刚体运动
机械臂是由一个个的刚体连接而成。为了分析机器人的运动,首先需要一个刚体的运动学模型。通过将一个参考框架固连在刚体上,就可以用描述这个框架位姿的 4 \times 4 矩阵来描述刚体的运动。
6083 个字词
|
30 分钟

