INDEX
Negative Logits
Locked
-0.08
Sheffield
-0.08
usement
-0.08
Steam
-0.08
deque
-0.08
indulg
-0.08
fæ
-0.08
シュ
-0.08
�
-0.07
queues
-0.07
POSITIVE LOGITS
Colors
0.09
inj
0.08
imb
0.08
simplex
0.08
incar
0.08
ób
0.07
assign
0.07
illegally
0.07
colors
0.07
distress
0.07
Activations Density 0.001%