INDEX
Negative Logits
.extend
-0.09
stroll
-0.08
cht
-0.07
vorming
-0.07
છીએ
-0.07
Rev
-0.07
464
-0.07
札
-0.07
ontwikkeling
-0.07
(y
-0.07
POSITIVE LOGITS
!!!!↵↵
0.10
男女
0.09
graduation
0.08
asta
0.08
Alta
0.08
benar
0.08
SAF
0.08
BBB
0.08
توفر
0.08
viable
0.08
Activations Density 0.180%