INDEX
Negative Logits
původ
-0.07
nemoc
-0.06
Advertisement
-0.06
venting
-0.06
ACC
-0.06
library
-0.06
�
-0.06
リ
-0.06
ecure
-0.06
Gareth
-0.06
POSITIVE LOGITS
prem
0.07
FIG
0.07
Kernel
0.06
restoration
0.06
(filename
0.06
violations
0.06
(be
0.06
chefs
0.06
collapse
0.06
pharm
0.06
Activations Density 0.001%