INDEX
Negative Logits
outright
-0.08
ga
-0.07
ודה
-0.07
приним
-0.07
Dari
-0.07
trump
-0.07
ga
-0.07
miscar
-0.07
ודות
-0.07
rowned
-0.07
POSITIVE LOGITS
gro
0.08
el
0.08
ennium
0.08
Cpp
0.07
Horizons
0.07
Fellows
0.07
elines
0.07
Articles
0.07
rapports
0.07
fiber
0.07
Activations Density 0.001%