INDEX
Negative Logits
sanctioned
-0.08
avering
-0.08
-this
-0.08
తిర
-0.08
ware
-0.07
endorsed
-0.07
سية
-0.07
بية
-0.07
arm
-0.07
führung
-0.07
POSITIVE LOGITS
pathlib
0.08
alguno
0.08
নির
0.08
photos
0.08
Palmer
0.08
photos
0.08
甲
0.08
cero
0.07
.photos
0.07
Pal
0.07
Activations Density 0.001%