INDEX
Negative Logits
He
-0.07
_Com
-0.07
(__
-0.07
DidEnter
-0.07
.gms
-0.07
بال
-0.07
EQUAL
-0.07
Read
-0.07
edReader
-0.06
rans
-0.06
POSITIVE LOGITS
opportun
0.07
狻
0.07
выбр
0.07
_crypto
0.07
interaction
0.07
/options
0.06
Marion
0.06
代理
0.06
otherwise
0.06
raham
0.06
Activations Density 0.002%