INDEX
Negative Logits
Haziran
-0.06
مث
-0.06
aft
-0.06
trunc
-0.06
Outlook
-0.06
шляхом
-0.06
삼성
-0.06
wcs
-0.06
chosen
-0.06
Ticaret
-0.06
POSITIVE LOGITS
`
0.07
posts
0.07
’es
0.07
disfr
0.07
etect
0.06
"`
0.06
#"
0.06
$:
0.06
독
0.06
withstand
0.06
Activations Density 0.002%