INDEX
Negative Logits
koruyucu
-0.85
memenangkan
-0.80
uscire
-0.80
váš
-0.79
стон
-0.77
Ausstellung
-0.76
cties
-0.74
흩
-0.74
Är
-0.74
cuerdas
-0.74
POSITIVE LOGITS
asing
0.82
Arbit
0.81
sorties
0.79
bassin
0.79
Medea
0.79
bair
0.77
Gestalt
0.76
quên
0.75
中野
0.75
prosa
0.74
Activations Density 0.013%