INDEX
Negative Logits
<Date
-0.08
aspir
-0.07
DATE
-0.07
<|reserved_200016|>
-0.07
(dialog
-0.07
731
-0.07
UP
-0.07
customized
-0.07
<|endoftext|>
-0.07
الت
-0.07
POSITIVE LOGITS
område
0.09
område
0.08
cumul
0.08
surcharge
0.08
offenders
0.08
facteur
0.08
指数
0.08
stek
0.08
-warning
0.08
incompet
0.08
Activations Density 0.002%