INDEX
Negative Logits
bumped
-0.07
oldem
-0.07
satisf
-0.06
willen
-0.06
"d
-0.06
NIL
-0.06
jury
-0.06
ndef
-0.06
BOTTOM
-0.06
sudoku
-0.06
POSITIVE LOGITS
/&
0.07
source
0.07
耐
0.06
휴
0.06
-play
0.06
Dự
0.06
Monica
0.06
Miller
0.06
eleri
0.06
тура
0.06
Activations Density 0.000%