INDEX
Negative Logits
assists
-0.08
הצליח
-0.07
Очень
-0.07
исп
-0.07
พยายาม
-0.07
熥
-0.07
hesitation
-0.07
战士来说
-0.07
很明显
-0.06
维持
-0.06
POSITIVE LOGITS
notes
0.07
-root
0.07
product
0.07
简
0.07
token
0.07
palette
0.07
ї
0.06
-domain
0.06
双
0.06
我就
0.06
Activations Density 0.058%