INDEX
Negative Logits
unsuccessful
-0.07
лада
-0.06
.eng
-0.06
Den
-0.06
_restart
-0.06
вопрос
-0.06
cams
-0.06
Bu
-0.06
ewhat
-0.06
_ori
-0.06
POSITIVE LOGITS
committed
0.07
relat
0.07
.awtextra
0.06
ตำ
0.06
dispatcher
0.06
Quy
0.06
ps
0.06
.tokens
0.06
Comments
0.06
!
0.06
Activations Density 0.007%