INDEX
Negative Logits
Sham
-0.07
tutto
-0.06
_of
-0.06
Connell
-0.06
مر
-0.06
_surf
-0.06
자연
-0.06
nf
-0.06
=cv
-0.06
ctl
-0.06
POSITIVE LOGITS
elay
0.06
يز
0.06
mist
0.06
ancing
0.06
tháng
0.06
хран
0.06
ceasefire
0.06
halt
0.06
див
0.06
дн
0.06
Activations Density 0.001%