Posts
Page 4 - Showing 8 of 75 posts
View all posts by years →流模型 Chapter2——去噪扩散概率模型(DDPM)
DDPM(Denoising Diffusion Probabilistic Models)是一种基于扩散过程的生成模型。它通过逐步向数据中添加噪声来模拟数据的生成过程,然后学习一个逆向过程来去除噪声,从而生成新的数据样本。
4047 个字词
|
20 分钟
大模型中的强化学习
大模型的预训练(next-token prediction)在形式上可以看作一种行为克隆(Behavioral Cloning, BC)—— 给定输入 x(上下文),最大化正确输出 y 的似然。
1996 个字词
|
10 分钟
贪心算法
贪心算法(Greedy Algorithm)是一种在每一步选择中都采取在当前状态下最好或最优(即最有利)的选择,从而希望导致结果是全局最好或最优的算法。贪心算法在某些问题上能够得到最优解,但并不适用于所有问题。
3232 个字词
|
16 分钟
二叉树
二叉树是数据结构中的重要内容,其操作主要依赖于遍历思想,包括深度优先搜索(DFS)和广度优先搜索(BFS)。本笔记将围绕二叉树的常见问题,按照原理和例题的模式进行组织。
2318 个字词
|
12 分钟
KMP 算法
KMP算法(Knuth-Morris-Pratt算法)是一种高效的字符串匹配算法,用于在主文本串(Text)中快速查找模式串(p)的出现位置。其核心思想是通过预处理模式串,利用已匹配的信息避免不必要的回溯,将时间复杂度从暴力匹配的 O(m*n) 优化至 O(m+n)。
1645 个字词
|
8 分钟
Collections
Tech Notes
Be a big fan of rising technologies.
Algorithm Notes
Woo. Time-tested wisdom.
强化学习合集
Notes on reading papers in the field of reinforcement learning.
Maths Laboratory
Do mathematics have a lab as well? Absolutely, with computer simulations.
生成式模型合集
Generative Models, modeling complex data distributions.
Tags

