INDEX
Negative Logits
Atl
-0.07
ocha
-0.06
자료
-0.06
_house
-0.06
statute
-0.06
กราคม
-0.06
ECB
-0.06
obstruction
-0.06
cro
-0.06
States
-0.06
POSITIVE LOGITS
Princess
0.07
_RANK
0.06
abusing
0.06
прибор
0.06
gid
0.06
0.06
sdl
0.06
così
0.06
つ
0.06
pedo
0.06
Activations Density 0.009%