INDEX
Negative Logits
F
0.55
d
0.52
her
0.50
מ
0.50
yn
0.50
their
0.48
f
0.48
the
0.48
toy
0.47
irl
0.47
POSITIVE LOGITS
UIServer
0.46
Ontario
0.46
Nawaz
0.46
Notiflix
0.46
emailer
0.46
activeIndex
0.46
بواسطة
0.45
ColorEffects
0.45
憉
0.45
ممكن
0.44
Activations Density 0.000%