INDEX
Negative Logits
?q
-0.07
甭
-0.07
אסור
-0.07
血腥
-0.07
徹
-0.07
.espresso
-0.07
以习近平
-0.07
.ActionBar
-0.07
סור
-0.07
auté
-0.06
POSITIVE LOGITS
shifting
0.08
pressured
0.07
больше
0.07
rather
0.07
もらえる
0.07
ופה
0.06
或
0.06
所述
0.06
hub
0.06
ippo
0.06
Activations Density 0.000%