INDEX
Negative Logits
interc
-0.08
dei
-0.08
MOS
-0.08
41
-0.07
estr
-0.07
Resp
-0.07
quorum
-0.07
IG
-0.07
Ore
-0.07
mosquito
-0.07
POSITIVE LOGITS
Bell
0.09
Bell
0.09
/bl
0.08
ifies
0.08
পরিচ
0.08
rl
0.07
ifying
0.07
谱
0.07
pump
0.07
يج
0.07
Activations Density 0.002%