INDEX
Negative Logits
_td
-0.08
�
-0.08
Bu
-0.08
達
-0.08
达
-0.07
dad
-0.07
Basil
-0.07
Uz
-0.07
Bal
-0.07
Kant
-0.07
POSITIVE LOGITS
Richmond
0.09
prest
0.08
taut
0.08
Freder
0.08
nj
0.08
Mercury
0.08
কা�
0.08
hil
0.07
(rv
0.07
consequential
0.07
Activations Density 0.002%