INDEX
Negative Logits
你们
-0.07
power
-0.07
notícia
-0.07
University
-0.07
queued
-0.07
untuk
-0.07
Produce
-0.07
России
-0.06
document
-0.06
cherche
-0.06
POSITIVE LOGITS
always
0.07
-am
0.07
GD
0.07
elementary
0.07
.habbo
0.07
.snap
0.07
afterward
0.07
()"↵
0.07
是否会
0.06
-Ass
0.06
Activations Density 0.001%