INDEX
Negative Logits
MOT
-0.07
_BODY
-0.07
adjust
-0.07
-0.07
ED
-0.07
consider
-0.07
_POST
-0.07
Success
-0.07
U
-0.07
ED
-0.07
POSITIVE LOGITS
understatement
0.09
μία
0.09
Palermo
0.08
éia
0.08
북한
0.08
temps
0.08
한국
0.08
Freddy
0.08
мың
0.08
palest
0.08
Activations Density 0.011%