INDEX
Negative Logits
192
-0.07
its
-0.07
根据
-0.07
808
-0.07
Bog
-0.07
indrome
-0.07
unim
-0.07
indy
-0.07
decom
-0.07
Christmas
-0.07
POSITIVE LOGITS
satin
0.09
GIR
0.09
obes
0.08
euros
0.08
‘y
0.08
Corridor
0.08
τω
0.08
girl
0.08
tecido
0.08
badan
0.08
Activations Density 0.001%