INDEX
Negative Logits
rifles
-0.07
-alert
-0.06
نامج
-0.06
finally
-0.06
cala
-0.06
emporary
-0.05
다가
-0.05
nějších
-0.05
autonom
-0.05
difficulty
-0.05
POSITIVE LOGITS
sanitation
0.07
defeats
0.07
여기
0.07
beneficial
0.07
_job
0.07
справи
0.07
оци
0.07
.insert
0.06
molest
0.06
="")↵
0.06
Activations Density 0.002%