INDEX
Negative Logits
?
1.67
다
1.49
ש
1.48
ו
1.45
ל
1.41
л
1.36
א
1.34
న
1.26
ط
1.24
ด
1.24
POSITIVE LOGITS
y
1.31
yta
1.15
I
1.15
ir
1.13
inou
1.13
ور
1.11
gk
1.11
рия
1.10
inces
1.10
ale
1.08
Activations Density 0.002%
?
다
ש
ו
ל
л
א
న
ط
ด
y
yta
I
ir
inou
ور
gk
рия
inces
ale