INDEX
Negative Logits
丁
-0.08
规律
-0.08
Mop
-0.07
ISCO
-0.07
noc
-0.07
રોજ
-0.07
lover
-0.07
tailoring
-0.07
श्र
-0.07
-0.07
POSITIVE LOGITS
worthiness
0.08
締
0.08
obligations
0.08
ૉ
0.07
obligation
0.07
choir
0.07
บท
0.07
soared
0.07
Ét
0.07
usuf
0.07
Activations Density 0.004%