INDEX
Negative Logits
Bhar
-0.25
ä¸ĭå·´
-0.25
ots
-0.25
consec
-0.24
uts
-0.24
atk
-0.24
usk
-0.24
/o
-0.24
primer
-0.24
fir
-0.23
POSITIVE LOGITS
honors
0.26
åѳ
0.26
slugg
0.25
æŃ£éĿ¢
0.25
èħIJèļĢ
0.25
petto
0.24
æĬ¼
0.24
onium
0.24
å¼ĢéĺĶ
0.24
("|0.23
Activations Density 0.002%