INDEX
Negative Logits
Privilege
-0.08
Linux
-0.08
/Linux
-0.08
Lov
-0.08
Linux
-0.08
ither
-0.07
privilegi
-0.07
/Nav
-0.07
whatsoever
-0.07
Gal
-0.07
POSITIVE LOGITS
clicar
0.09
哭
0.08
涙
0.08
quilt
0.08
cliquant
0.08
itters
0.08
cotton
0.08
Clicking
0.08
ouli
0.08
捕
0.08
Activations Density 0.001%