INDEX
Negative Logits
irgende
-0.08
responders
-0.08
leben
-0.08
bedeutet
-0.08
Aber
-0.08
jamais
-0.08
Smarty
-0.07
Thema
-0.07
replication
-0.07
mehr
-0.07
POSITIVE LOGITS
_po
0.08
estima
0.07
_Vector
0.07
fi
0.07
462
0.07
bathing
0.07
po
0.07
poj
0.07
po
0.07
470
0.07
Activations Density 0.001%