INDEX
Negative Logits
ocene
-0.08
Deutsche
-0.07
ци
-0.07
(E
-0.06
Turing
-0.06
Soci
-0.06
ec
-0.06
Holocaust
-0.06
ک
-0.06
ent
-0.06
POSITIVE LOGITS
pad
0.11
Pad
0.11
pads
0.10
Pad
0.09
pad
0.09
PAD
0.09
ad
0.08
pack
0.08
PAD
0.08
AR
0.08
Activations Density 0.009%