INDEX
Negative Logits
ת
1.27
↵↵
1.23
のです
1.16
なりません
1.15
СТИ
1.15
ין
1.14
сти
1.11
רק
1.11
ل
1.11
тину
1.08
POSITIVE LOGITS
it
2.03
lleno
1.52
ik
1.48
가
1.40
ises
1.34
ită
1.32
ਆ
1.31
n
1.27
pelos
1.26
५
1.26
Activations Density 0.001%
ת
↵↵
のです
なりません
СТИ
ין
сти
רק
ل
тину
it
lleno
ik
가
ises
ită
ਆ
n
pelos
५