INDEX
Negative Logits
grading
-0.08
(PR
-0.07
-0.07
investigations
-0.07
NL
-0.07
investigating
-0.07
'>{-0.07
이렇게
-0.07
entails
-0.07
-0.07
POSITIVE LOGITS
кроме
0.09
except
0.09
都有
0.09
except
0.08
især
0.08
behalve
0.08
Ding
0.08
excepto
0.08
चाहे
0.07
sauf
0.07
Activations Density 0.050%