INDEX
Negative Logits
�
-0.09
atten
-0.08
inm
-0.08
MOS
-0.08
egg
-0.08
continual
-0.08
�
-0.07
inc
-0.07
Egg
-0.07
footing
-0.07
POSITIVE LOGITS
委员
0.08
ERATION
0.08
اجر
0.08
Sir
0.08
ाप
0.07
ाकार
0.07
ாண
0.07
(?)
0.07
护
0.07
werk
0.07
Activations Density 0.003%