INDEX
Negative Logits
Blues
-0.08
TYPO
-0.08
/the
-0.07
personalized
-0.07
démarche
-0.07
给
-0.07
Generic
-0.07
들에게
-0.07
slave
-0.07
interop
-0.07
POSITIVE LOGITS
Payload
0.08
Payload
0.08
دست
0.08
یعنی
0.08
dast
0.08
seid
0.08
vendar
0.08
comprenant
0.08
payload
0.08
yani
0.08
Activations Density 0.001%