INDEX
Negative Logits
青
-0.08
Quincy
-0.07
Klein
-0.07
EEK
-0.07
şüph
-0.07
Cherry
-0.07
-win
-0.07
清
-0.06
(xx
-0.06
ekran
-0.06
POSITIVE LOGITS
Mot
0.18
Mot
0.16
mot
0.14
mot
0.14
MOT
0.12
_mot
0.11
motivations
0.11
motivation
0.10
Moto
0.10
motivated
0.10
Activations Density 0.014%