INDEX
Negative Logits
vigorous
-0.07
enou
-0.07
LENG
-0.07
zeal
-0.07
vigor
-0.07
affidavit
-0.07
ABCDE
-0.06
nob
-0.06
спе
-0.06
Bro
-0.06
POSITIVE LOGITS
64
0.07
effortlessly
0.06
_update
0.06
unsqueeze
0.06
.news
0.06
help
0.06
선을
0.06
ımızı
0.06
.ct
0.06
GORITHM
0.06
Activations Density 0.010%