INDEX
Negative Logits
sz
-0.08
argues
-0.08
advocating
-0.08
Mold
-0.08
arguing
-0.08
理念
-0.08
Pill
-0.07
öss
-0.07
खे
-0.07
اهمیت
-0.07
POSITIVE LOGITS
Wilson
0.09
yayi
0.08
Abra
0.08
Wilson
0.08
Abra
0.08
dey
0.08
parker
0.08
ınıza
0.08
gatsby
0.08
OTC
0.08
Activations Density 0.007%