INDEX
Negative Logits
overst
-0.09
Executive
-0.08
/or
-0.08
Infant
-0.08
Hol
-0.07
ाते
-0.07
infant
-0.07
Hof
-0.07
ih
-0.07
verm
-0.07
POSITIVE LOGITS
ln
0.08
succ
0.08
일
0.08
Adr
0.07
naga
0.07
NEL
0.07
lim
0.07
ality
0.07
名
0.07
<double
0.07
Activations Density 0.024%