INDEX
Negative Logits
gesproken
-0.08
กระ
-0.07
dow
-0.07
drills
-0.07
WK
-0.07
titulo
-0.07
aurante
-0.07
Espí
-0.07
elétr
-0.07
staat
-0.07
POSITIVE LOGITS
80
0.10
660
0.09
670
0.09
700
0.09
_EXTERN
0.09
850
0.08
70
0.08
78
0.08
350
0.08
_MAN
0.08
Activations Density 0.002%