INDEX
Negative Logits
odb
-0.07
Seb
-0.07
Ish
-0.07
poste
-0.07
ెల
-0.07
ele
-0.07
painless
-0.07
Memo
-0.07
tl
-0.07
Vat
-0.07
POSITIVE LOGITS
listen
0.08
كين
0.08
Hammer
0.08
fart
0.08
Gould
0.07
пер
0.07
ły
0.07
prick
0.07
стоя
0.07
Soto
0.07
Activations Density 0.002%