INDEX
Negative Logits
pn
-0.07
itere
-0.07
Cause
-0.07
sur
-0.07
board
-0.06
subgroup
-0.06
бі
-0.06
全
-0.06
VELO
-0.06
Universities
-0.06
POSITIVE LOGITS
texture
0.07
columnName
0.07
NTAX
0.06
Denver
0.06
ादन
0.06
-
0.06
rež
0.06
따른
0.06
仪
0.06
_inactive
0.06
Activations Density 0.006%