INDEX
Negative Logits
iators
-0.07
atings
-0.07
令人
-0.07
�
-0.06
_done
-0.06
nedir
-0.06
Chore
-0.06
ير
-0.06
prof
-0.06
ูกค
-0.06
POSITIVE LOGITS
کیف
0.07
silah
0.06
kommt
0.06
count
0.06
specializing
0.06
cooperative
0.06
amazon
0.06
.office
0.06
Sharing
0.06
obedient
0.06
Activations Density 0.003%