INDEX
Negative Logits
ICC
-0.09
mob
-0.08
deft
-0.08
زر
-0.07
Show
-0.07
gama
-0.07
Sim
-0.07
misuse
-0.07
提
-0.07
Sim
-0.07
POSITIVE LOGITS
ric
0.08
Lewis
0.08
Lewis
0.08
aland
0.08
astian
0.08
edilen
0.08
Ra
0.08
grain
0.07
spath
0.07
stature
0.07
Activations Density 0.002%