INDEX
Negative Logits
dial
-0.09
nak
-0.08
Cox
-0.08
dialect
-0.08
interrog
-0.07
CME
-0.07
Kre
-0.07
바
-0.07
dial
-0.07
meios
-0.07
POSITIVE LOGITS
Apost
0.08
Interiors
0.08
anat
0.08
bedr
0.08
0.08
secluded
0.07
成绩
0.07
<Input
0.07
0.07
quelle
0.07
Activations Density 0.003%