从零开始学 AI - 第一章:图像分类
首次发布: 2026-03-30
... 次访问
图像分类是计算机视觉中的基本任务之一,目标是将输入的图像分配到预定义的类别中。给定一个图像 x \in \mathbb{R}^{H \times W \times C},其中 H、W 和 C 分别表示图像的高度、宽度和通道数,图像分类的目标是学习出一个图像到类别的映射
6095 个字词
|
30 分钟
从零开始学 AI - 第二章:图像分割
首次发布: 2026-04-05
... 次访问
图像分割(Image Segmentation)是计算机视觉中比图像分类更为精细的任务。如果说图像分类回答的是“这张图里有什么”,那么图像分割则要回答“它们在哪里”以及“每个像素属于哪个对象”。其核心目标是将输入图像的每一个像素分配到一个特定的语义类别或实例标识中,从而实现对图像内容的像素级理解。
10971 个字词
|
55 分钟
从零开始学 AI - 第三章:文本翻译、文本理解与文本生成
首次发布: 2026-04-14
... 次访问
在前两章中,我们主要探讨了一些与图像相关的机器学习任务。图像数据通常是一个三维张量 (高度、宽度、通道)。给定一张图像 x,可以形式化表示为
23503 个字词
|
118 分钟