INDEX
Negative Logits
dude
-0.08
miners
-0.08
dépend
-0.07
Kü
-0.07
असे
-0.07
Yr
-0.07
sequ
-0.07
ERE
-0.07
valu
-0.07
abruptly
-0.07
POSITIVE LOGITS
/or
0.08
forth
0.08
oz
0.08
635
0.07
reacts
0.07
تع
0.07
resh
0.07
罩
0.07
iented
0.07
مد
0.07
Activations Density 0.030%