INDEX
Negative Logits
theoretically
-0.08
Validator
-0.07
forbidden
-0.07
S
-0.07
242
-0.07
ain
-0.07
234
-0.07
729
-0.07
or
-0.07
rypt
-0.07
POSITIVE LOGITS
각각
0.09
그렇
0.09
에서는
0.09
namelijk
0.08
삼성
0.08
versione
0.08
_else
0.08
칭
0.08
sekal
0.08
ieee
0.08
Activations Density 0.052%