INDEX
Negative Logits
antha
-0.16
Rah
-0.15
frauen
-0.15
Eternal
-0.15
asar
-0.14
inux
-0.14
677
-0.14
ilos
-0.14
enko
-0.14
ummer
-0.14
POSITIVE LOGITS
èĻ«
0.15
å£
0.15
hut
0.15
Axe
0.15
Ey
0.14
crop
0.14
iona
0.14
akk
0.14
odie
0.14
itis
0.14
Activations Density 0.005%