INDEX
Negative Logits
Comedy
-0.08
Adaptor
-0.07
小說
-0.07
ម្ម
-0.07
.PLAIN
-0.07
Trivia
-0.07
-liked
-0.07
cifra
-0.07
humorous
-0.07
Lig
-0.07
POSITIVE LOGITS
ukl
0.08
عليكم
0.08
xd
0.08
Zon
0.08
surg
0.07
.xr
0.07
utford
0.07
dot
0.07
pets
0.07
seeing
0.07
Activations Density 0.014%