INDEX
Negative Logits
Robin
-0.08
Cla
-0.08
”活动
-0.08
dolayı
-0.08
ibur
-0.08
ولې
-0.08
Wrest
-0.07
lié
-0.07
výro
-0.07
){-0.07
POSITIVE LOGITS
freezes
0.09
trusting
0.09
.todos
0.08
freeze
0.08
updater
0.08
0.08
updating
0.08
frozen
0.08
404
0.07
froze
0.07
Activations Density 0.002%