INDEX
Negative Logits
打卡
-0.08
/package
-0.08
inclus
-0.07
iveness
-0.07
link
-0.07
aval
-0.07
babes
-0.07
job
-0.07
还好
-0.07
lush
-0.07
POSITIVE LOGITS
eating
0.07
#'
0.07
lcd
0.06
frog
0.06
最先
0.06
ührung
0.06
�
0.06
👌
0.06
violated
0.06
emphasizing
0.06
Activations Density 0.004%