INDEX
Negative Logits
wick
-0.08
drinking
-0.08
courting
-0.08
coffee
-0.08
jualan
-0.08
下注
-0.08
partido
-0.08
Clinic
-0.07
Lange
-0.07
fili
-0.07
POSITIVE LOGITS
_errors
0.08
संदेश
0.08
mtu
0.08
prune
0.08
erreurs
0.08
/null
0.08
त्र
0.08
_msgs
0.08
/report
0.07
Messages
0.07
Activations Density 0.002%