INDEX
Negative Logits
Bern
-0.08
kön
-0.08
bert
-0.08
应
-0.07
Bain
-0.07
κι
-0.07
bey
-0.07
ymi
-0.07
gris
-0.07
brill
-0.07
POSITIVE LOGITS
Stayed
0.09
ീഷ
0.08
인트
0.08
cellspacing
0.08
Stayed
0.08
••
0.07
ekst
0.07
INTRO
0.07
stayed
0.07
Տ
0.07
Activations Density 0.005%