INDEX
Negative Logits
30
-0.08
ig
-0.08
Data
-0.08
Downloader
-0.07
आलो
-0.07
igay
-0.07
igs
-0.07
대표
-0.07
168
-0.07
sév
-0.07
POSITIVE LOGITS
embarrassment
0.09
hören
0.08
tafel
0.08
徴
0.08
rumours
0.08
tape
0.08
оставить
0.08
кли
0.08
slang
0.08
unchecked
0.08
Activations Density 0.001%