INDEX
Negative Logits
ذه
-0.08
لله
-0.07
sad
-0.07
olls
-0.07
spheres
-0.07
男子
-0.07
orth
-0.07
杆
-0.07
ούμε
-0.07
جدًا
-0.07
POSITIVE LOGITS
menopause
0.08
죽
0.08
�
0.08
hasil
0.08
listrik
0.08
xmax
0.08
sustainably
0.08
рен
0.08
riol
0.07
检查
0.07
Activations Density 0.002%