Jacobian and Gradients
首次发布: 2025-06-15
... 次访问
本文是对张量微分的一些思考。先从一个定理开始引入本文的内容。
769 个字词
|
4 分钟
Reverse KL Divergence
首次发布: 2025-06-25
... 次访问
The KL Divergence (KLD) is defined as
605 个字词
|
3 分钟
Do we really need encoders for generative models?
首次发布: 2025-06-27
... 次访问
In modern generative AI, encoders are commonly used during training to help models understand the context of input data. However, these encoders are often removed during inference. This raises an interesting question, if we train models using only decoders, can they still generate meaningful outputs?
529 个字词
|
3 分钟
矩阵向量的梯度
首次发布: 2025-07-20
... 次访问
这里介绍求解矩阵或者向量梯度的一个便捷方法。
982 个字词
|
5 分钟
Larangian Multiplier Method
首次发布: 2025-07-20
... 次访问
在优化问题中,我们经常需要在满足若干约束条件的前提下,寻找目标函数的极值。典型形式是:
1367 个字词
|
7 分钟
Kronecker Product
首次发布: 2025-07-27
... 次访问
克劳内克积(Kronecker Product)是两个矩阵的乘积,结果是一个新的矩阵,其元素是原矩阵元素的乘积。对于两个矩阵 A 和 B,其克劳内克积记作 A \otimes B。常用于信号处理、图像处理等领域。也叫做张量积或直积。
765 个字词
|
4 分钟
Fourier and Wavelets for Deep Learning
首次发布: 2025-12-08
... 次访问
令 f\in L^2(\mathbb{R})。傅里叶变换(在 L^2 意义下)把信号表示为全局正弦基的叠加:
3373 个字词
|
17 分钟
变分法基础
首次发布: 2026-02-23
... 次访问
变分学是研究泛函极值(以及更一般的临界值)的一个数学分支,在机器学习、物理学等领域有广泛的应用。
4571 个字词
|
23 分钟