INDEX
Negative Logits
aders
-0.09
गर
-0.08
iro
-0.08
cerca
-0.08
homage
-0.08
smarter
-0.08
linha
-0.08
ale
-0.08
Equip
-0.07
gestalten
-0.07
POSITIVE LOGITS
σ
0.09
Fl
0.09
Br
0.09
σ
0.09
Koop
0.08
_identity
0.08
bran
0.08
fl
0.08
113
0.08
Tl
0.07
Activations Density 0.018%