只是:
考虑具有5个类别(或类)的分类问题。
在的情况下cce
,一个热门目标可能是[0, 1, 0, 0, 0]
并且模型可以预测[.2, .5, .1, .1, .1]
(可能正确)
在的情况下scce
,目标索引可以是[1],并且模型可以预测:[.5]。
现在考虑具有3个类别的分类问题。
大多数分类模型会产生一时熵和分类熵,因为它可以节省空间,但是在使用稀疏模型时会丢失很多信息(例如,在第二种情况下,索引2也非常接近)。我总是一口气研究cce
模型输出的可靠性。
简而言之,sparse_categorical_crossentropy
当您的类是互斥的时使用,即您根本不在乎其他足够接近的预测。