INDEX
Negative Logits
assy
-0.08
�
-0.08
.Join
-0.08
rump
-0.08
ง
-0.07
okup
-0.07
Railroad
-0.07
.netty
-0.07
督
-0.07
Ben
-0.07
POSITIVE LOGITS
shap
0.08
vit
0.08
дозвол
0.08
pakk
0.08
允许
0.07
软件
0.07
mật
0.07
पत्र
0.07
_check
0.07
BMP
0.07
Activations Density 0.000%