INDEX
Negative Logits
constraint
-0.08
ៀ
-0.08
tør
-0.08
ottom
-0.07
adina
-0.07
stance
-0.07
fog
-0.07
phants
-0.07
क्का
-0.07
azza
-0.07
POSITIVE LOGITS
Institute
0.08
vá
0.08
obwohl
0.08
आनंद
0.08
0.07
cope
0.07
PEM
0.07
0.07
प्रिय
0.07
går
0.07
Activations Density 0.001%