INDEX
Negative Logits
ablish
-0.08
死
-0.08
prince
-0.08
�
-0.08
whipping
-0.08
анал
-0.08
Stuff
-0.08
dad
-0.07
았다
-0.07
Pir
-0.07
POSITIVE LOGITS
constr
0.08
degrees
0.07
amo
0.07
computational
0.07
عليه
0.07
Detailed
0.07
αριθ
0.07
numeric
0.07
నలు
0.07
.number
0.07
Activations Density 0.000%