INDEX
Negative Logits
ktor
-0.08
loved
-0.08
brave
-0.08
loor
-0.08
visible
-0.07
infinit
-0.07
onan
-0.07
wants
-0.07
вой
-0.07
を書く
-0.07
POSITIVE LOGITS
-long
0.09
పాటు
0.09
inals
0.08
хват
0.08
/day
0.08
года
0.08
ago
0.07
/year
0.07
Domestic
0.07
geleden
0.07
Activations Density 0.021%