INDEX
Negative Logits
adx
-0.08
intuitive
-0.08
success
-0.08
heta
-0.08
ady
-0.08
prior
-0.07
.idx
-0.07
impl
-0.07
solve
-0.07
직
-0.07
POSITIVE LOGITS
ciert
0.08
peliculas
0.08
πως
0.08
Pues
0.08
fatto
0.08
cenas
0.08
oe
0.07
Company's
0.07
caf
0.07
رو
0.07
Activations Density 0.009%