INDEX
Negative Logits
HMS
-0.08
Homer
-0.08
/movie
-0.08
tg
-0.08
homeless
-0.08
/H
-0.07
tg
-0.07
Hv
-0.07
pait
-0.07
/respond
-0.07
POSITIVE LOGITS
fu
0.08
ysy
0.07
55
0.07
ces
0.07
يعد
0.07
ati
0.07
auri
0.07
widespread
0.07
FU
0.07
lineup
0.07
Activations Density 0.035%