INDEX
Negative Logits
Alber
-0.08
aphyl
-0.07
ERR
-0.07
infot
-0.07
でも
-0.07
clicked
-0.07
hospitalization
-0.07
ATING
-0.07
mad
-0.07
પણ
-0.07
POSITIVE LOGITS
.setup
0.09
consisted
0.08
.examples
0.08
igit
0.08
നിയ
0.08
verdeeld
0.08
sleepers
0.08
رجال
0.08
-rest
0.08
یوں
0.07
Activations Density 0.003%