INDEX
Negative Logits
galaxies
-0.08
Nat
-0.07
dogs
-0.07
葡
-0.07
ăm
-0.07
Rasmussen
-0.07
TP
-0.07
ingar
-0.07
Pager
-0.07
ആ
-0.07
POSITIVE LOGITS
assassination
0.09
potency
0.08
집중
0.08
Clean
0.08
removal
0.08
potentials
0.08
enal
0.08
gede
0.08
White
0.08
iffs
0.07
Activations Density 0.003%