INDEX
Negative Logits
几
-0.06
执
-0.06
egl
-0.06
agu
-0.06
…but
-0.06
_news
-0.06
šetření
-0.06
liar
-0.06
ограф
-0.06
Downloader
-0.06
POSITIVE LOGITS
Meteor
0.07
Leafs
0.06
sore
0.06
dese
0.06
Begins
0.06
Dev
0.06
PRE
0.06
uro
0.06
Floyd
0.06
Syntax
0.06
Activations Density 0.002%