INDEX
Negative Logits
uc
-0.09
duc
-0.08
rota
-0.07
Lac
-0.07
dolo
-0.07
transcript
-0.07
fu
-0.07
suv
-0.07
uc
-0.07
tomada
-0.07
POSITIVE LOGITS
联系人
0.08
air
0.08
�
0.08
/apple
0.08
terr
0.07
Helen
0.07
-lit
0.07
Ascending
0.07
待遇
0.07
ophie
0.07
Activations Density 0.021%