INDEX
Negative Logits
bully
-0.09
Vip
-0.08
sky
-0.07
ukua
-0.07
photographic
-0.07
الس
-0.07
ij
-0.07
ülen
-0.07
vip
-0.07
Sky
-0.07
POSITIVE LOGITS
utmost
0.08
latex
0.08
Leib
0.08
Och
0.08
ateway
0.08
estrict
0.08
Harper
0.08
Tom
0.07
962
0.07
Toy
0.07
Activations Density 0.007%