INDEX
Negative Logits
Lak
-0.08
BE
-0.08
Hewlett
-0.08
meas
-0.08
glass
-0.07
ensuing
-0.07
cou
-0.07
taun
-0.07
Mitch
-0.07
lak
-0.07
POSITIVE LOGITS
航
0.11
_org
0.07
Mand
0.07
그대로
0.07
용
0.07
Austin
0.07
парков
0.07
장
0.07
々
0.07
apse
0.07
Activations Density 0.004%