INDEX
Negative Logits
roken
-0.08
ERICA
-0.07
�州
-0.06
exhaustive
-0.06
ueva
-0.06
ремон
-0.06
peptide
-0.06
ارد
-0.06
دة
-0.06
_context
-0.06
POSITIVE LOGITS
is
0.08
Ames
0.07
licit
0.07
_margin
0.06
.cd
0.06
рус
0.06
allows
0.06
anyways
0.06
Pee
0.06
:i
0.06
Activations Density 0.001%