INDEX
Negative Logits
snaží
-0.07
最初
-0.07
oversees
-0.07
cred
-0.06
ولك
-0.06
.descripcion
-0.06
Unknown
-0.06
.addTab
-0.06
desde
-0.06
문자
-0.06
POSITIVE LOGITS
fats
0.06
detach
0.06
rer
0.06
olle
0.06
기타
0.06
-made
0.06
11
0.06
Martins
0.06
(tp
0.06
취
0.05
Activations Density 0.051%