INDEX
Negative Logits
-3.25
↵↵
-3.19
-2.83
-2.42
greateſt
-2.41
…
-2.38
-2.34
人也
-2.25
at
-2.17
等到
-2.17
POSITIVE LOGITS
;
2.78
彣
2.77
اً
2.72
桖
2.67
Would
2.67
erintah
2.58
壟
2.58
objectif
2.53
するので
2.48
綃
2.47
Activations Density 0.019%
↵↵
greateſt
…
人也
at
等到
;
彣
اً
桖
Would
erintah
壟
objectif
するので
綃