INDEX
Negative Logits
chuyển
-0.07
ुष
-0.07
competence
-0.06
vista
-0.06
panicked
-0.06
penalty
-0.06
렀
-0.06
гля
-0.06
disposal
-0.06
Springs
-0.06
POSITIVE LOGITS
_MULT
0.07
rotterdam
0.07
및
0.07
154
0.06
.OUT
0.06
_param
0.06
uge
0.06
ありがとう
0.06
minX
0.06
charset
0.06
Activations Density 0.008%