INDEX
Negative Logits
ימ
-0.08
Lydia
-0.08
pode
-0.08
Girls
-0.07
positivos
-0.07
Lama
-0.07
ווים
-0.07
feminino
-0.07
meninas
-0.07
blik
-0.07
POSITIVE LOGITS
rq
0.09
ndarray
0.08
eld
0.08
harvested
0.08
frei
0.08
expressive
0.08
ave
0.07
espace
0.07
identifiable
0.07
extracted
0.07
Activations Density 0.001%