INDEX
Negative Logits
πτυ
-0.07
brawl
-0.06
DialogContent
-0.06
_windows
-0.06
้ำ
-0.06
низ
-0.06
Beth
-0.06
≥
-0.06
мерикан
-0.06
вает
-0.06
POSITIVE LOGITS
ерина
0.07
Pand
0.07
Chic
0.06
pand
0.06
and
0.06
徳
0.06
artist
0.06
does
0.06
/use
0.06
VALID
0.06
Activations Density 0.037%