INDEX
Negative Logits
åŁİ乡
-0.34
Lear
-0.29
estion
-0.27
ador
-0.26
ion
-0.26
switch
-0.26
è§Ĥ
-0.25
gender
-0.24
eo
-0.24
trag
-0.24
POSITIVE LOGITS
åĬ©æĶ»
0.26
ä½Ĩå®ĥ
0.26
.slim
0.25
äºĨä¸Ģéģį
0.24
Fires
0.24
Flames
0.24
èģĬèģĬ
0.24
_unpack
0.24
łģ
0.24
ä¸Ńæĸ°ç½ij
0.24
Activations Density 0.027%