INDEX
Negative Logits
adjust
-0.09
adjusted
-0.08
(ad
-0.08
Fees
-0.08
Til
-0.08
fees
-0.08
ידע
-0.07
Tema
-0.07
-fashioned
-0.07
Doctrine
-0.07
POSITIVE LOGITS
hyst
0.08
anay
0.08
stomach
0.08
Healthy
0.07
yey
0.07
Elliot
0.07
heck
0.07
肤
0.07
brit
0.07
Gastr
0.07
Activations Density 0.000%