INDEX
Negative Logits
ensors
-0.07
ानद
-0.07
Конститу
-0.06
便
-0.06
роме
-0.06
γη
-0.06
ospital
-0.06
اصفه
-0.06
нем
-0.06
орм
-0.06
POSITIVE LOGITS
extracomment
0.06
Contrib
0.06
Pro
0.06
�
0.06
acomp
0.06
Προ
0.06
app
0.06
smuggling
0.06
alcoholic
0.06
_header
0.05
Activations Density 0.040%