INDEX
Negative Logits
-fired
-0.09
.month
-0.07
hin
-0.07
_sent
-0.07
definitions
-0.07
/mm
-0.07
_generate
-0.07
διαφορε
-0.07
herent
-0.07
-warning
-0.07
POSITIVE LOGITS
trecho
0.10
ijds
0.09
فترة
0.09
corridor
0.08
ijdt
0.08
accessing
0.08
czas
0.08
Andre
0.08
durée
0.08
السكر
0.08
Activations Density 0.003%