INDEX
Negative Logits
ethic
-0.08
appetite
-0.08
electroly
-0.08
glauben
-0.08
paternal
-0.07
locality
-0.07
disent
-0.07
EA
-0.07
olde
-0.07
Gul
-0.07
POSITIVE LOGITS
Schr
0.08
ON
0.08
账
0.07
bothered
0.07
ాఖ
0.07
/ar
0.07
ప
0.07
numer
0.07
柄
0.07
床
0.07
Activations Density 0.011%