INDEX
Negative Logits
Português
-0.08
ETO
-0.07
bul
-0.07
வட
-0.07
মার্চ
-0.07
-member
-0.07
Seu
-0.07
assat
-0.07
esmag
-0.07
gwar
-0.07
POSITIVE LOGITS
siglo
0.08
akang
0.08
manga
0.08
jt
0.08
_ep
0.08
ep
0.08
팬
0.08
fout
0.08
.ep
0.07
couches
0.07
Activations Density 0.001%