INDEX
Negative Logits
�
-0.06
resisted
-0.06
reveal
-0.06
weg
-0.06
duplicates
-0.06
WHICH
-0.06
YOU
-0.05
distur
-0.05
"(\<
-0.05
seq
-0.05
POSITIVE LOGITS
Promo
0.07
.core
0.06
�
0.06
органів
0.06
Coy
0.06
القرآن
0.06
έν
0.06
-num
0.06
\Module
0.06
يان
0.06
Activations Density 0.712%