代价函数和输出单元的选择密切相关,两者都需要根据输出的分布确定。如何选择输出单元,要看预测值的分布,这跟指数族分布和广义线性回归中的结论一致。如何选择代价函数,大多数时候,可以简单地使用数据分布和模型分布间的交叉熵,这实际上等同于最大似然。本文的主要内容参考花书的第6章。
线性单元&均方误差
线性单元
对应损失函数为均方误差
常用来预测高斯分布的均值
sigmoid单元
sigmoid单元
对应损失函数为交叉熵
常用来预测Bernoulli分布的概率$p$
softmax单元
softmax单元
对应损失函数为交叉熵
其中,N为样本个数,K为类别数。
用来预测Multinoulli分布的各个类别概率。