INDEX
Negative Logits
Programmer
-0.10
Apprentice
-0.09
枪
-0.09
PU
-0.08
Bullet
-0.08
Funnel
-0.08
twenties
-0.08
Golf
-0.08
twintig
-0.08
.chk
-0.08
POSITIVE LOGITS
でき
0.07
variant
0.07
مش
0.07
اء
0.07
conduction
0.07
easily
0.07
(native
0.07
�
0.07
धो
0.07
exhibited
0.07
Activations Density 0.000%