INDEX
Negative Logits
DA
-0.07
oothing
-0.07
anager
-0.06
comer
-0.06
اجع
-0.06
isp
-0.06
objs
-0.06
_Items
-0.06
AGER
-0.06
oding
-0.06
POSITIVE LOGITS
askeri
0.07
_dim
0.07
폭
0.06
vendor
0.06
Embassy
0.06
dissatisfaction
0.06
ug
0.06
Log
0.06
population
0.06
populations
0.06
Activations Density 0.014%