INDEX
Negative Logits
ãĥªãĥ³
-0.10
ehr
-0.09
ï½Ľ
-0.09
fts
-0.09
į¼
-0.09
à¹ģà¸Ľà¸¥à¸ĩ
-0.09
urv
-0.08
Ruf
-0.08
page
-0.08
Nobel
-0.08
POSITIVE LOGITS
apat
0.18
lation
0.14
ataires
0.12
alse
0.10
dG
0.09
akin
0.09
ated
0.09
ypi
0.09
596
0.09
ypy
0.08
Activations Density 0.048%