INDEX
Negative Logits
Cruc
-0.09
구
-0.08
hyster
-0.08
Canton
-0.08
탄
-0.07
CRO
-0.07
لم
-0.07
illumination
-0.07
امه
-0.07
edies
-0.07
POSITIVE LOGITS
bu
0.08
Bowling
0.08
とな
0.08
paw
0.07
potent
0.07
怎么
0.07
π
0.07
inde
0.07
Anyway
0.07
.times
0.07
Activations Density 0.001%