INDEX
Negative Logits
poolt
-0.09
thats
-0.09
sluts
-0.09
Killer
-0.08
Uz
-0.08
leri
-0.08
szyst
-0.08
Downloader
-0.08
nok
-0.08
zomb
-0.08
POSITIVE LOGITS
printf
0.08
dial
0.08
pathological
0.07
idm
0.07
议
0.07
discreet
0.07
:path
0.07
剂
0.07
下来
0.07
静
0.07
Activations Density 0.000%