INDEX
Negative Logits
Greene
-0.08
ുള്ള
-0.08
meras
-0.07
Lov
-0.07
强
-0.07
-Type
-0.07
abajo
-0.07
Apost
-0.07
Lal
-0.07
്ണ
-0.07
POSITIVE LOGITS
முக
0.09
cock
0.08
చిర
0.08
mensaje
0.08
செய்வ
0.07
Mensaje
0.07
மூ
0.07
এরপর
0.07
தேசிய
0.07
zitter
0.07
Activations Density 0.035%