INDEX
Negative Logits
Lies
-0.07
-0.07
Rob
-0.07
Shapiro
-0.07
ngon
-0.07
ris
-0.06
pixmap
-0.06
نگهد
-0.06
alc
-0.06
غر
-0.06
POSITIVE LOGITS
century
0.08
Century
0.08
-century
0.07
fancy
0.07
edin
0.07
ucid
0.07
-serif
0.06
candy
0.06
-course
0.06
cling
0.06
Activations Density 0.012%