INDEX
Negative Logits
disturbance
-0.08
区
-0.08
langfrist
-0.08
597
-0.08
tientallen
-0.07
carried
-0.07
_pic
-0.07
ત્ર
-0.07
605
-0.07
Theodore
-0.07
POSITIVE LOGITS
ра
0.08
-controlled
0.08
PRES
0.07
recall
0.07
angkat
0.07
Lou
0.07
дош
0.07
sneak
0.07
pam
0.07
Rise
0.07
Activations Density 0.005%