INDEX
Negative Logits
fringe
-0.08
enlarged
-0.08
Enlarg
-0.08
child's
-0.08
binary
-0.08
term
-0.07
senator
-0.07
Fringe
-0.07
-0.07
Reduc
-0.07
POSITIVE LOGITS
�
0.08
金
0.08
�
0.08
따
0.08
orsi
0.08
quets
0.08
ുകയ
0.08
കളും
0.08
(colors
0.08
(color
0.08
Activations Density 0.002%