INDEX
Negative Logits
603
-0.09
Pon
-0.08
Pl
-0.08
pusat
-0.08
precautions
-0.08
வழ
-0.08
صرف
-0.08
alk
-0.08
कानून
-0.07
посв
-0.07
POSITIVE LOGITS
(!!
0.08
relu
0.08
beast
0.08
rapped
0.08
Hidden
0.08
.Multi
0.07
agma
0.07
excels
0.07
Gradient
0.07
Nossa
0.07
Activations Density 0.002%