INDEX
Negative Logits
numeric
-0.08
nice
-0.08
own
-0.08
lay
-0.08
rscheinlichkeit
-0.08
था
-0.08
goog
-0.07
numer
-0.07
erm
-0.07
reated
-0.07
POSITIVE LOGITS
visionnement
0.13
vals
0.12
pri
0.12
pr
0.11
Pri
0.11
pr
0.11
pr
0.11
pris
0.10
pi
0.10
(pr
0.10
Activations Density 0.001%