INDEX
Negative Logits
filos
-0.08
cpp
-0.08
vowel
-0.07
zam
-0.07
sentiments
-0.07
arab
-0.07
html
-0.07
keram
-0.07
noun
-0.07
Moodle
-0.07
POSITIVE LOGITS
仙
0.10
heaven
0.09
大奖
0.08
大仙
0.08
至尊
0.08
县
0.08
凰
0.08
怪
0.08
755
0.08
至尊
0.08
Activations Density 0.007%