INDEX
Negative Logits
acc
-0.08
Popup
-0.08
-put
-0.08
hurdles
-0.07
Spell
-0.07
速
-0.07
punishment
-0.07
-0.07
聚
-0.07
Popup
-0.07
POSITIVE LOGITS
aparato
0.09
dispositivo
0.08
loan
0.08
quite
0.08
rena
0.08
τά
0.08
manufacture
0.08
device
0.07
устройств
0.07
στεί
0.07
Activations Density 0.001%