INDEX
Negative Logits
malo
-0.08
evolved
-0.08
plate
-0.08
loot
-0.07
Leeds
-0.07
Plate
-0.07
marquee
-0.07
që
-0.07
textarea
-0.07
Louise
-0.07
POSITIVE LOGITS
Wehr
0.09
Deco
0.09
�
0.08
®
0.08
♂
0.08
тах
0.08
.atan
0.08
译
0.08
Decoder
0.08
deco
0.07
Activations Density 0.001%