INDEX
Negative Logits
DTS
-0.08
골
-0.07
Prism
-0.07
Salem
-0.07
골
-0.07
airing
-0.07
starch
-0.07
Tween
-0.07
Newman
-0.07
'em
-0.07
POSITIVE LOGITS
disappointment
0.09
lawful
0.09
좋
0.08
令
0.08
positiv
0.08
ుద
0.08
Consistency
0.08
ുദ്ധ
0.07
sha
0.07
_PS
0.07
Activations Density 0.036%