INDEX
Negative Logits
.Admin
-0.07
IN
-0.07
in
-0.06
constructs
-0.06
offence
-0.06
Muj
-0.06
persuaded
-0.06
оза
-0.06
Ja
-0.06
(in
-0.06
POSITIVE LOGITS
/graph
0.07
gut
0.07
abama
0.07
slut
0.06
धन
0.06
्रपत
0.06
dayan
0.06
udrž
0.06
CISION
0.06
SECRET
0.06
Activations Density 0.019%