INDEX
Negative Logits
pad
-0.09
patch
-0.08
Pad
-0.07
.pad
-0.07
virus
-0.07
unjust
-0.07
roman
-0.07
/data
-0.07
unnecessary
-0.07
flame
-0.07
POSITIVE LOGITS
Walking
0.08
ounted
0.08
interiors
0.08
WALK
0.08
Ablauf
0.08
kei
0.08
Positioned
0.08
REET
0.08
fühl
0.08
travers
0.08
Activations Density 0.014%