INDEX
Negative Logits
.bl
-0.09
BL
-0.08
Evrop
-0.08
Ree
-0.08
.ham
-0.07
辽
-0.07
Igor
-0.07
height
-0.07
Tar
-0.07
hamed
-0.07
POSITIVE LOGITS
された
0.10
constitu
0.09
उठ
0.09
explicitly
0.08
餐
0.08
federal
0.08
ienia
0.08
ப்பட்ட
0.08
sponsored
0.08
necklace
0.08
Activations Density 0.007%