INDEX
Negative Logits
ite
-0.08
ane
-0.07
ep
-0.07
demonstrate
-0.07
opus
-0.07
quarry
-0.07
emer
-0.07
openness
-0.07
uck
-0.07
Pog
-0.07
POSITIVE LOGITS
العرب
0.09
杜
0.09
әйел
0.08
delinc
0.08
таны
0.08
萨
0.08
TR
0.08
الثلاث
0.08
男女
0.08
falsa
0.08
Activations Density 0.000%