INDEX
Negative Logits
Buddhism
-0.08
demeanor
-0.08
Vietnam
-0.08
edly
-0.07
lays
-0.07
socialism
-0.07
에서
-0.07
_and
-0.07
conducts
-0.07
Mart
-0.07
POSITIVE LOGITS
parche
0.09
gewährleisten
0.08
сав
0.08
eingesetzt
0.08
داسې
0.08
ей
0.08
набор
0.08
.Cluster
0.08
नियुक्त
0.08
اره
0.08
Activations Density 0.005%