INDEX
Negative Logits
minimizing
-0.08
iyatı
-0.07
lakh
-0.06
twig
-0.06
під
-0.06
.Produ
-0.06
preferred
-0.06
녕하세요
-0.06
Arte
-0.06
/pi
-0.06
POSITIVE LOGITS
äft
0.10
cram
0.10
Vienna
0.10
ße
0.07
_blend
0.07
ths
0.06
ine
0.06
examine
0.06
Gamma
0.06
H
0.06
Activations Density 0.003%