INDEX
Negative Logits
idel
-0.07
balcon
-0.07
popular
-0.07
extracomment
-0.06
uyen
-0.06
12
-0.06
anni
-0.06
panties
-0.06
xab
-0.06
categorized
-0.06
POSITIVE LOGITS
force
0.12
Force
0.11
Force
0.10
-force
0.10
forces
0.08
.force
0.08
FORCE
0.08
SSF
0.08
_ef
0.08
Way
0.08
Activations Density 0.027%