INDEX
Negative Logits
/(
-0.07
Việt
-0.07
gou
-0.06
’en
-0.06
won
-0.06
'en
-0.06
bird
-0.06
ogs
-0.06
-is
-0.06
_K
-0.06
POSITIVE LOGITS
ела
0.08
جمله
0.07
Jwt
0.06
Daisy
0.06
systematically
0.06
photographs
0.06
telephone
0.06
alert
0.06
Appointment
0.06
すべて
0.06
Activations Density 0.004%