INDEX
Negative Logits
Data
-0.06
�
-0.06
arat
-0.06
024
-0.06
Discount
-0.06
bottom
-0.06
τησε
-0.06
atom
-0.06
Race
-0.06
ulture
-0.06
POSITIVE LOGITS
expr
0.07
Mut
0.06
0.06
allied
0.06
покры
0.06
-framework
0.06
"use
0.06
rieg
0.06
οι
0.06
česk
0.06
Activations Density 0.016%