INDEX
Negative Logits
#[
-0.07
爱好
-0.07
ሥ
-0.06
SUP
-0.06
Tổ
-0.06
фиг
-0.06
St
-0.06
Pod
-0.06
庄
-0.06
⬛
-0.06
POSITIVE LOGITS
ją
0.08
ata
0.08
.INTEGER
0.07
declining
0.07
arna
0.07
因其
0.07
נחה
0.07
ей
0.07
חצי
0.07
方向
0.07
Activations Density 0.001%