INDEX
Negative Logits
Cruc
-0.07
gyr
-0.07
�
-0.07
Quart
-0.07
betray
-0.07
Quart
-0.07
lage
-0.07
fashioned
-0.07
Sack
-0.07
ders
-0.07
POSITIVE LOGITS
feats
0.08
ment
0.08
attained
0.08
reproduc
0.07
itar
0.07
.sm
0.07
feat
0.07
ach
0.07
erzielt
0.07
convergence
0.07
Activations Density 0.026%