INDEX
Negative Logits
ام
-0.08
garage
-0.07
appreciating
-0.07
ostante
-0.07
pos
-0.07
eyeliner
-0.07
elsker
-0.07
ilerin
-0.07
nikdy
-0.07
uw
-0.07
POSITIVE LOGITS
.ob
0.09
特色
0.08
,没有
0.08
.rem
0.08
españolas
0.08
.cat
0.08
.normal
0.08
wana
0.08
>[]
0.08
,要
0.08
Activations Density 0.017%