它们都是正确的,但是从数值稳定性的角度来看,您是首选。
你开始
e ^ (x - max(x)) / sum(e^(x - max(x))
通过使用a ^(b-c)=(a ^ b)/(a ^ c)的事实
= e ^ x / (e ^ max(x) * sum(e ^ x / e ^ max(x)))
= e ^ x / sum(e ^ x)
另一个答案是什么。您可以将max(x)替换为任何变量,它将被抵消。
如何在Python中实现Softmax函数
它们都是正确的,但是从数值稳定性的角度来看,您是首选。
你开始
e ^ (x - max(x)) / sum(e^(x - max(x))
通过使用a ^(b-c)=(a ^ b)/(a ^ c)的事实
= e ^ x / (e ^ max(x) * sum(e ^ x / e ^ max(x)))
= e ^ x / sum(e ^ x)
另一个答案是什么。您可以将max(x)替换为任何变量,它将被抵消。