INDEX
Negative Logits
stressed
-0.09
metallurgy
-0.08
mil
-0.08
是谁
-0.08
sdf
-0.08
hey
-0.08
Imperial
-0.08
�
-0.07
banking
-0.07
spars
-0.07
POSITIVE LOGITS
ystal
0.08
definite
0.08
taht
0.08
_seq
0.07
0.07
_lv
0.07
Dummy
0.07
_literal
0.07
0.07
iteral
0.07
Activations Density 0.003%