INDEX
Negative Logits
ogle
-0.06
obile
-0.05
ilo
-0.05
zc
-0.05
chan
-0.05
groom
-0.05
oka
-0.05
manipulated
-0.05
isle
-0.05
away
-0.05
POSITIVE LOGITS
(æ°´
0.09
Ïģη
0.08
ñana
0.08
_ABC
0.07
еÑħ
0.07
VEL
0.07
IFY
0.07
ãĥ¼ãĥģ
0.06
anky
0.06
ÙĨزد
0.06
Activations Density 0.001%