INDEX
Negative Logits
synopsis
-0.08
青
-0.07
Germany
-0.07
Germany
-0.07
илання
-0.07
"One
-0.06
druhé
-0.06
_day
-0.06
hunger
-0.06
.ToBoolean
-0.06
POSITIVE LOGITS
skirts
0.09
skirt
0.08
prostituerade
0.07
azaar
0.07
quets
0.07
Queen
0.07
/***
0.07
册
0.06
warf
0.06
forming
0.06
Activations Density 0.006%