INDEX
Negative Logits
alth
-0.13
reck
-0.13
presumed
-0.10
ẹn
-0.10
_DRV
-0.09
Maze
-0.09
reck
-0.09
λεÏħ
-0.09
NewProp
-0.09
orgia
-0.08
POSITIVE LOGITS
mean
0.16
suspect
0.14
c
0.11
Mean
0.11
.e
0.11
suspects
0.11
sp
0.10
hab
0.10
pv
0.10
’;m
0.10
Activations Density 0.110%