INDEX
Negative Logits
aghan
-0.07
přib
-0.07
USERS
-0.07
дем
-0.07
HERE
-0.07
GW
-0.07
Elon
-0.07
owied
-0.07
Grand
-0.06
.way
-0.06
POSITIVE LOGITS
:c
0.07
_sections
0.06
_difference
0.06
C
0.06
detailing
0.06
iOS
0.06
revised
0.06
conceal
0.06
trainer
0.06
C
0.06
Activations Density 0.015%