INDEX
Negative Logits
adag
-0.08
duck
-0.08
conosc
-0.08
touch
-0.07
kick
-0.07
schuld
-0.07
metall
-0.07
Maurice
-0.07
yang
-0.07
Pf
-0.07
POSITIVE LOGITS
-benar
0.10
0.08
209
0.08
overt
0.07
程度
0.07
ніше
0.07
sequ
0.07
ஞ்ச
0.07
нап
0.07
excepcional
0.07
Activations Density 0.003%