INDEX
Negative Logits
-white
-0.07
Bowman
-0.07
hombre
-0.07
ચૂ
-0.07
wesen
-0.07
Edwards
-0.07
blade
-0.07
razem
-0.07
flattened
-0.07
spe
-0.07
POSITIVE LOGITS
Beled
0.10
岸
0.09
vk
0.08
cript
0.08
ounding
0.08
.Pass
0.08
Meetup
0.08
ביעה
0.08
.task
0.07
uario
0.07
Activations Density 0.000%