INDEX
Negative Logits
imposed
-0.08
vmax
-0.08
.freq
-0.08
nees
-0.08
eingef
-0.08
imenta
-0.07
�
-0.07
fonctionner
-0.07
Tup
-0.07
sind
-0.07
POSITIVE LOGITS
mă
0.08
kir
0.07
аса
0.07
Kir
0.07
bırak
0.07
psych
0.07
EL
0.07
ß
0.07
Eight
0.07
Saint
0.07
Activations Density 0.015%