INDEX
Negative Logits
炮
-0.07
cin
-0.07
Organ
-0.07
가장
-0.06
نمود
-0.06
implies
-0.06
América
-0.06
inp
-0.06
ample
-0.06
yy
-0.06
POSITIVE LOGITS
express
0.07
jestli
0.07
ิญญ
0.07
شة
0.06
.lastName
0.06
inspection
0.06
종
0.06
capacidad
0.06
usting
0.06
eighty
0.06
Activations Density 0.000%