INDEX
Negative Logits
Sachs
-0.07
libertarian
-0.07
erior
-0.06
iq
-0.06
вост
-0.06
Becker
-0.06
Ryan
-0.06
보고
-0.06
energetic
-0.06
后
-0.06
POSITIVE LOGITS
і
0.07
.GO
0.07
CoreApplication
0.06
_STR
0.06
acje
0.06
股
0.06
(em
0.06
जनत
0.06
aleza
0.06
(.
0.06
Activations Density 0.020%