INDEX
Negative Logits
noin
-0.08
-0.08
tako
-0.08
kuru
-0.08
Lean
-0.07
ਸਮ
-0.07
pril
-0.07
nisi
-0.07
PLUS
-0.07
CU
-0.07
POSITIVE LOGITS
unclear
0.09
bride
0.08
Ander
0.08
Municipality
0.08
而言
0.08
ಿಧ
0.08
谁
0.08
why
0.07
consequence
0.07
ись
0.07
Activations Density 0.010%