INDEX
Negative Logits
unte
-0.17
ades
-0.15
fol
-0.14
ä¸ĸ
-0.14
ugar
-0.14
ater
-0.14
pek
-0.14
acher
-0.14
uder
-0.14
CD
-0.14
POSITIVE LOGITS
ing
0.19
ers
0.18
/web
0.18
-style
0.16
/Web
0.15
/stream
0.15
omanip
0.15
/books
0.15
ellan
0.15
zie
0.15
Activations Density 0.008%