损失函数

概论

“损失”即所有样本的“误差”的总和，亦即（m为样本数）
$损失 = \sum_{i=0}^{m-1} 误差_i \\J = \sum_{i=0}^{m-1} loss_i$

作用就是计算神经网络每次迭代的前向计算结果与真实值的差距，从而指导下一步的训练向正确的方向进行

m为样本数，a为预测值， y为标本标签值
0-1损失函数
$J = \sum_{i=0}^{m-1} loss_i, loss = \begin{cases}0 \qquad a = y\\1 \qquad a \neq y\end{cases}$

绝对值损失函数
$J = \sum_{i=0}^{m-1} loss_i, loss = \left y - a \right$

铰链/折页损失函数或最大边界损失函数，主要用于SVM（支持向量SVM）中

$J = \sum_{i=0}^{m-1} loss_i, loss = max0, 1-y \cdot a, y = \pm 1$

对数损失函数，又叫交叉熵损失函数 用于分类

$J = \sum_{i=0}^{m-1} loss_i, loss = - \left [ y\log a + 1 -y\log 1-a \right ]$

均方差损失函数 用于回归

$J = \sum_{i=0}^{m-1} loss_i, loss = a -y^2$

指数差损失函数

$J = \sum_{i=0}^{m-1} loss_i, loss = e^{-y \cdot a }$