INDEX
Negative Logits
throat
-0.08
verste
-0.08
среди
-0.08
.TV
-0.08
bie
-0.07
связ
-0.07
Avalon
-0.07
priv
-0.07
др
-0.07
northeastern
-0.07
POSITIVE LOGITS
pivotal
0.09
OU
0.08
mol
0.08
Genuine
0.07
mpl
0.07
Swim
0.07
fol
0.07
wala
0.07
Plus
0.07
ζ
0.07
Activations Density 0.001%