INDEX
Negative Logits
examiner
-0.08
lif
-0.08
filmer
-0.07
Lad
-0.07
yada
-0.07
Clouds
-0.07
-minded
-0.07
וצ
-0.07
répart
-0.07
quadru
-0.07
POSITIVE LOGITS
]
0.08
�
0.07
acked
0.07
prim
0.07
hodin
0.07
zat
0.07
NAM
0.07
hil
0.07
kosa
0.07
.cross
0.07
Activations Density 0.008%