INDEX
Negative Logits
flair
-0.09
Canarias
-0.08
èr
-0.08
brown
-0.08
گو
-0.08
Ghana
-0.08
Guatemala
-0.07
Ug
-0.07
wohl
-0.07
Glory
-0.07
POSITIVE LOGITS
negligence
0.08
项
0.08
envers
0.08
fiduci
0.07
chores
0.07
partida
0.07
خي
0.07
duties
0.07
Field
0.07
項
0.07
Activations Density 0.005%