INDEX
Negative Logits
men's
-0.08
-ha
-0.07
owi
-0.07
rere
-0.07
enie
-0.07
,:)
-0.07
POV
-0.07
שה
-0.07
dét
-0.07
Pav
-0.07
POSITIVE LOGITS
0.08
----------↵
0.07
Corte
0.07
fel
0.07
كنت
0.07
"""↵↵
0.07
----↵
0.07
والس
0.07
—↵↵
0.07
Dor
0.07
Activations Density 0.062%