INDEX
Negative Logits
ξεις
-0.07
$(
-0.07
PBS
-0.07
$(
-0.06
riculum
-0.06
_AS
-0.06
आश
-0.06
Lexus
-0.06
coh
-0.06
běh
-0.06
POSITIVE LOGITS
0.06
0.06
_take
0.06
ursed
0.06
0.06
JO
0.06
ekk
0.06
kt
0.06
doch
0.06
_transient
0.06
Activations Density 0.002%