INDEX
Negative Logits
animated
-0.07
combination
-0.07
mobile
-0.07
imaginable
-0.07
漳州
-0.07
Coupon
-0.07
employed
-0.07
ุ
-0.06
Norwich
-0.06
Intersection
-0.06
POSITIVE LOGITS
ologi
0.07
CAL
0.07
случа
0.07
thiệt
0.06
Fra
0.06
eli
0.06
芑
0.06
法令
0.06
檄
0.06
arse
0.06
Activations Density 0.025%