INDEX
Negative Logits
bax
-0.08
�
-0.07
juicy
-0.07
ferrovi
-0.07
тех
-0.07
wang
-0.07
abang
-0.07
제작
-0.07
SALE
-0.07
고민
-0.07
POSITIVE LOGITS
0.09
0.08
Mir
0.08
0.08
mirac
0.08
Kubernetes
0.08
mirror
0.08
0.08
تو
0.07
understatement
0.07
Activations Density 0.005%