INDEX
Negative Logits
Grave
-0.08
DROP
-0.08
lập
-0.08
dub
-0.08
sq
-0.07
чик
-0.07
qu
-0.07
straße
-0.07
Parcel
-0.07
grave
-0.07
POSITIVE LOGITS
norms
0.08
AE
0.08
理念
0.08
cle
0.08
liberal
0.07
ual
0.07
JJ
0.07
践
0.07
pena
0.07
�
0.07
Activations Density 0.026%