INDEX
Negative Logits
æĹ¶æĬ¥
-0.26
æ¡Įä¸Ĭ
-0.25
gloves
-0.25
çļĦçľ¼
-0.25
å¼¼
-0.24
-Clause
-0.24
Kenn
-0.23
Larson
-0.23
(sample
-0.23
çĶ«
-0.23
POSITIVE LOGITS
åıĪ
0.29
åıĪèĥ½
0.29
orte
0.29
对äºİæĪij们
0.26
éĩijæ²Ļ
0.25
ours
0.25
nowhere
0.25
name
0.24
orts
0.24
parch
0.24
Activations Density 0.014%