INDEX
Negative Logits
)
-2.97
في
-2.91
In
-2.77
-
-2.70
do
-2.61
-
-2.58
To
-2.53
2
-2.52
所有
-2.42
You
-2.41
POSITIVE LOGITS
itſelf
3.22
疍
3.16
涐
3.08
水彩
2.94
Ꮉ
2.92
茘
2.89
2.84
嗵
2.83
——”
2.83
2.81
Activations Density 0.016%
)
في
In
-
do
-
To
2
所有
You
itſelf
疍
涐
水彩
Ꮉ
茘
嗵
——”