INDEX
Negative Logits
inarian
-0.08
onsite
-0.08
ight
-0.07
善
-0.07
isky
-0.07
тра
-0.07
-0.07
edik
-0.07
.Ap
-0.07
รับ
-0.07
POSITIVE LOGITS
/<
0.08
IND
0.08
attribute
0.08
Elliott
0.08
Spect
0.07
leiden
0.07
وال
0.07
enthalten
0.07
فول
0.07
_ind
0.07
Activations Density 0.008%