INDEX
Negative Logits
,'
-0.07
Cul
-0.06
Ant
-0.06
STATS
-0.06
Geg
-0.06
Julius
-0.06
Science
-0.06
CUR
-0.06
dizzy
-0.06
'\\
-0.06
POSITIVE LOGITS
YM
0.12
unsupported
0.07
Grace
0.07
عل
0.07
rate
0.07
βα
0.06
accredited
0.06
ddie
0.06
boro
0.06
xde
0.06
Activations Density 0.001%