INDEX
Negative Logits
gaand
-0.09
Gre
-0.08
уул
-0.07
administra
-0.07
TRANS
-0.07
gaande
-0.07
Wikia
-0.07
ವಾಗಿ
-0.07
Grund
-0.07
наиболее
-0.07
POSITIVE LOGITS
Abl
0.08
mei
0.07
verloren
0.07
ослов
0.07
tuin
0.07
mein
0.07
hinaus
0.07
Highlands
0.07
ிகளை
0.07
sympathetic
0.07
Activations Density 0.005%