感知机

Perceptron

感知机用于二分类线性问题

感知机的数学定义

假设输入空间 $\mathcal{X} \subseteq \mathbb{R}^n$,输出空间是 $\mathcal{Y} = \{+1, -1\}$。由输入空间到输出空间的如下函数:

称为感知机。其中,$w$ 和 $b$ 为感知机模型参数,前者叫 weight,后者叫 bias,点乘运算为向量内积。$\operatorname{sign}$ 是符号函数,具体定义如下:

感知机学习策略

假设数据集线性可分,定义感知机学习的损失函数为:

其中,$M$ 是误分类点的集合,我们的目标是极小化 $L(w, b)$。

感知机学习算法的原始形式

随机初始化 $w$ 和 $b$,分别记为 $w_0$ 和 $b_0$,然后在训练数据集中选取数据 $(\vec{x_i}, y_i)$;如果 $y_i(\vec{w} \cdot \vec{x_i} + b) \leq 0$,

重复上述选择更新过程直至没有误分类点。

感知机学习算法的对偶形式

与原始形式不同,对原始形式使用拉格朗日对偶化,得到相应的对偶形式。首先初始化系数和偏置 $\alpha \leftarrow 0, b \leftarrow 0$。再在训练集中选取数据 $(x_i, y_i)$;如果 $y_i \left(\sum_{j = 1}^{N} \alpha_j y_j x_j \cdot x_i + b \right) \leq 0$,则更新

tips

可以预处理出所有输入实例间的内积,并将其存为一个矩阵,这个矩阵叫做 Gram 矩阵,


感知机
http://example.com/2025/06/03/感知机/
作者
ddccffq
发布于
2025年6月3日
许可协议