INDEX
Negative Logits
sip
-0.10
Sheng
-0.08
Compt
-0.08
gall
-0.07
kaz
-0.07
完善
-0.07
CRE
-0.07
열
-0.07
pog
-0.07
ρεί
-0.07
POSITIVE LOGITS
dieser
0.08
incidental
0.08
Wagner
0.08
n't
0.07
nac
0.07
Shakespeare
0.07
Wa
0.07
_final
0.07
pts
0.07
ون
0.07
Activations Density 0.005%