损失函数
2025年3月12日 星期三
15:23
Softmax
在实际 中,在应用Softmax公式之前,如果序列中的最大值很大,需要将原始值减去序列中的最大值,如果不减去,那么这个最大值,经过指数运算后,e^(max_value)可能会很大,超出数值范围,所以需要对序列norm一下。
已使用 OneNote 创建。