INDEX
Negative Logits
objective
-0.07
غيل
-0.07
Soviet
-0.07
Bolshevik
-0.07
mView
-0.07
nieuwe
-0.06
_RUN
-0.06
orc
-0.06
ach
-0.06
ون
-0.06
POSITIVE LOGITS
còn
0.08
була
0.07
/as
0.06
Min
0.06
억
0.06
あの
0.06
hesab
0.06
zend
0.06
昭和
0.06
đau
0.06
Activations Density 0.151%