INDEX
Negative Logits
sy
-0.09
yx
-0.08
syz
-0.08
verwe
-0.08
erat
-0.07
chid
-0.07
storm
-0.07
ändig
-0.07
োব
-0.07
chast
-0.07
POSITIVE LOGITS
ac
0.14
ac
0.12
_ac
0.10
التنظيم
0.10
cognitive
0.09
-ac
0.09
acic
0.09
-c
0.09
acs
0.09
/ac
0.09
Activations Density 0.001%