INDEX
Negative Logits
stuff
-0.09
captive
-0.08
capt
-0.08
laying
-0.07
plats
-0.07
stuff
-0.07
呢
-0.07
創
-0.07
hely
-0.07
@s
-0.07
POSITIVE LOGITS
0.09
Kent
0.08
Benedict
0.08
►
0.08
NATO
0.08
Tro
0.08
omal
0.08
Keith
0.08
Keynes
0.08
�
0.07
Activations Density 0.037%