INDEX
Negative Logits
मौ
-0.08
چ
-0.08
deceit
-0.08
mər
-0.08
Christine
-0.07
meis
-0.07
lind
-0.07
vak
-0.07
dag
-0.07
Δ
-0.07
POSITIVE LOGITS
=subprocess
0.09
subtitles
0.08
opy
0.08
열
0.08
/std
0.07
politely
0.07
applying
0.07
apart
0.07
UL
0.07
preparo
0.07
Activations Density 0.002%