INDEX
Negative Logits
amation
-0.07
samen
-0.07
Rwanda
-0.07
补
-0.06
cona
-0.06
زيد
-0.06
efter
-0.06
APS
-0.06
५
-0.06
-placement
-0.06
POSITIVE LOGITS
oud
0.06
ieee
0.06
liking
0.06
ohn
0.06
Mah
0.06
operative
0.06
]:=
0.06
restraint
0.06
(["
0.06
metam
0.06
Activations Density 0.005%