INDEX
Negative Logits
muted
-0.09
ASEAN
-0.08
martial
-0.08
θ
-0.07
.Constant
-0.07
yin
-0.07
enclosing
-0.07
zone
-0.07
adeeg
-0.07
ω
-0.07
POSITIVE LOGITS
_Print
0.08
ERA
0.08
нан
0.08
Printer
0.08
_CHAR
0.08
_PREF
0.07
_Header
0.07
Username
0.07
కం
0.07
Glam
0.07
Activations Density 0.002%