INDEX
Negative Logits
<|endoftext|>
-0.10
<|reserved_200016|>
-0.08
presumably
-0.08
б
-0.07
Σ
-0.07
/(?
-0.07
_set
-0.07
063
-0.07
_neg
-0.07
Ez
-0.07
POSITIVE LOGITS
měla
0.09
měli
0.09
Nueva
0.09
Greeks
0.08
矿
0.08
petroleum
0.08
kuring
0.08
mynta
0.08
boya
0.08
میری
0.08
Activations Density 0.267%