INDEX
Negative Logits
Nh
-0.06
��
-0.06
strcpy
-0.06
평가
-0.06
리에
-0.06
shm
-0.06
etsk
-0.06
aren
-0.06
めた
-0.06
tolerate
-0.05
POSITIVE LOGITS
barang
0.08
DETAIL
0.07
mos
0.07
ソ
0.07
Mess
0.07
ه
0.07
GGLE
0.06
μβρίου
0.06
เศรษฐ
0.06
_GOOD
0.06
Activations Density 0.000%