INDEX
Negative Logits
Pencil
-0.08
ultim
-0.07
NSW
-0.07
Paste
-0.07
cura
-0.07
Ndi
-0.07
১২
-0.07
subcategory
-0.07
Ner
-0.07
ERING
-0.07
POSITIVE LOGITS
themselves
0.08
部
0.08
階
0.08
unit
0.07
частью
0.07
Unit
0.07
equivalent
0.07
moradores
0.07
erview
0.07
ವರ
0.07
Activations Density 0.005%