INDEX
Negative Logits
hips
-0.09
sar
-0.08
видов
-0.08
Wagner
-0.08
tep
-0.08
削
-0.07
Pend
-0.07
Hew
-0.07
Cerr
-0.07
resin
-0.07
POSITIVE LOGITS
-benar
0.09
ward
0.09
-handed
0.08
Franco
0.08
ящие
0.07
most
0.07
enth
0.07
объ
0.07
đây
0.07
ящ
0.07
Activations Density 0.060%