INDEX
Negative Logits
labelled
-0.08
crime
-0.07
labeled
-0.07
posts
-0.06
site
-0.06
che
-0.06
newcom
-0.06
card
-0.06
resize
-0.06
अगर
-0.06
POSITIVE LOGITS
Dane
0.07
�
0.07
UN
0.06
inium
0.06
LocalizedString
0.06
γρα
0.06
국
0.06
ste
0.06
Gson
0.06
option
0.06
Activations Density 0.001%