凛冬将至

从简单的例子开始

0%

代价函数与输出单元

代价函数和输出单元的选择密切相关,两者都需要根据输出的分布确定。如何选择输出单元,要看预测值的分布,这跟指数族分布和广义线性回归中的结论一致。如何选择代价函数,大多数时候,可以简单地使用数据分布和模型分布间的交叉熵,这实际上等同于最大似然。本文的主要内容参考花书的第6章。

线性单元&均方误差

线性单元

对应损失函数为均方误差

常用来预测高斯分布的均值

sigmoid单元

sigmoid单元

对应损失函数为交叉熵

常用来预测Bernoulli分布的概率$p$

softmax单元

softmax单元

对应损失函数为交叉熵

其中,N为样本个数,K为类别数。

用来预测Multinoulli分布的各个类别概率。