INDEX
Negative Logits
-gener
-0.09
_gener
-0.08
Harness
-0.08
elämä
-0.08
-producing
-0.08
.gener
-0.08
поколения
-0.07
еген
-0.07
vivant
-0.07
Volkswagen
-0.07
POSITIVE LOGITS
וז
0.08
complaint
0.08
PSD
0.07
annoyance
0.07
ણ
0.07
dp
0.07
ទ
0.07
artos
0.07
اله
0.07
ishy
0.07
Activations Density 0.000%