INDEX
Negative Logits
Saving
-0.07
klas
-0.06
walk
-0.06
DU
-0.06
secure
-0.06
ゲーム
-0.06
-0.06
litre
-0.06
ска
-0.06
Giving
-0.06
POSITIVE LOGITS
ук
0.07
všechny
0.07
退出
0.06
ckså
0.06
funciona
0.06
yps
0.06
松
0.06
能源
0.06
phon
0.06
unca
0.06
Activations Density 0.020%