INDEX
Negative Logits
feel
-0.08
rl
-0.08
kte
-0.08
te
-0.07
ln
-0.07
Dale
-0.07
l
-0.07
nobody
-0.07
skyline
-0.07
throat
-0.07
POSITIVE LOGITS
ous
0.14
us
0.12
US
0.11
OS
0.10
OUS
0.10
aceous
0.09
ious
0.09
os
0.09
oss
0.09
ΟΣ
0.09
Activations Density 0.053%