INDEX
Negative Logits
cups
-0.08
consists
-0.08
consisted
-0.08
بعنوان
-0.07
Ike
-0.07
Tudor
-0.07
efu
-0.07
chairs
-0.07
eficaz
-0.07
corp
-0.07
POSITIVE LOGITS
moro
0.08
Rh
0.08
GLE
0.07
nie
0.07
мног
0.07
ζω
0.07
mux
0.07
(get
0.07
enius
0.07
üm
0.07
Activations Density 0.007%