INDEX
Negative Logits
Lockheed
-0.07
Disabled
-0.07
isclosed
-0.06
่ง
-0.06
habitat
-0.06
Disabled
-0.06
高校
-0.06
newX
-0.06
-readable
-0.06
女人
-0.06
POSITIVE LOGITS
0.07
serde
0.07
assign
0.07
ี่
0.07
risky
0.07
0.06
anticipate
0.06
shuffle
0.06
này
0.06
solve
0.06
Activations Density 0.033%