INDEX
Negative Logits
mund
-0.08
Wolfe
-0.08
woman
-0.07
dismin
-0.07
Hamilton
-0.07
iw
-0.07
reporters
-0.07
那
-0.07
menjaga
-0.07
kens
-0.07
POSITIVE LOGITS
rộng
0.10
coverage
0.09
覆盖
0.09
weiten
0.09
开展
0.08
Coverage
0.08
Vertrieb
0.08
weite
0.08
couvr
0.08
covering
0.08
Activations Density 0.095%