INDEX
Negative Logits
ensin
-0.07
kay
-0.07
سل
-0.07
gh
-0.07
cm
-0.07
Explorer
-0.07
siin
-0.07
Blond
-0.07
sage
-0.07
Tus
-0.07
POSITIVE LOGITS
sock
0.09
Bod
0.08
ilka
0.07
Locke
0.07
把
0.07
defamatory
0.07
OCK
0.07
Ying
0.07
allback
0.07
kapet
0.07
Activations Density 0.001%