INDEX
Negative Logits
COLOR
-0.07
sólo
-0.06
�
-0.06
organis
-0.06
rightfully
-0.06
ану
-0.06
+l
-0.06
point
-0.06
"});↵
-0.06
ifs
-0.06
POSITIVE LOGITS
frac
0.07
अप
0.06
twentieth
0.06
Imp
0.06
_WAIT
0.06
slugg
0.06
transgender
0.06
divorced
0.06
_WIN
0.06
그의
0.06
Activations Density 0.077%