INDEX
Negative Logits
rál
-0.07
duplicated
-0.06
vested
-0.06
016
-0.06
microscope
-0.06
lux
-0.06
_sin
-0.06
heaters
-0.06
annual
-0.06
''.
-0.06
POSITIVE LOGITS
ασία
0.07
istingu
0.07
Participant
0.07
Mum
0.07
همراه
0.07
-community
0.06
Army
0.06
よび
0.06
이렇게
0.06
상태
0.06
Activations Density 0.024%