INDEX
Negative Logits
donuts
-0.08
otin
-0.08
standers
-0.08
understatement
-0.07
घेत
-0.07
.pc
-0.07
resist
-0.07
ugl
-0.07
ਦੁ
-0.07
نگاه
-0.07
POSITIVE LOGITS
William
0.09
Exper
0.08
tampoco
0.08
Hills
0.08
Moon
0.08
Scal
0.07
Moreno
0.07
แ
0.07
궁
0.07
증
0.07
Activations Density 0.058%