所有文章
第 2 页 - 当前显示 8 篇,共 75 篇文章
按年份查看所有文章 →Linux 学习笔记 3 —— 核心命令与系统管理
Linux系统的一个核心设计哲学是”一切皆文件”,这一理念在设备管理上体现得淋漓尽致。本章将带你深入了解Linux如何将硬件设备抽象为文件,以及如何与这些设备进行高效、安全的交互。
4124 个字词
|
21 分钟
从零开始学 AI - 第一章:图像分类
图像分类是计算机视觉中的基本任务之一,目标是将输入的图像分配到预定义的类别中。给定一个图像 x \in \mathbb{R}^{H \times W \times C},其中 H、W 和 C 分别表示图像的高度、宽度和通道数,图像分类的目标是学习出一个图像到类别的映射
6095 个字词
|
30 分钟
Foundational Models 论文阅读合集 1
14538 个字词
|
73 分钟
FlowRL - Matching Reward Distributions for LLM Reasoning
Large language model (LLM) reasoning is typically formulated as a conditional generation problem: given a question \mathbf{x} \in \mathcal{X}, a policy model \pi_{\theta}(\mathbf{y}|\mathbf{x}) generates an answer \mathbf{y} \in \mathcal{Y}. The quality of the answer is evaluated by a task-specific reward signal r(\mathbf{x}, \mathbf{y}). In reasoning tasks, the reward is usually sparse and terminal (e.g., correctness of the final answer), which means we consider one-step reward instead of returns (i.e., discounted sum of rewards over time steps).
1536 个字词
|
8 分钟

