INDEX
Negative Logits
典型
0.28
Contents
0.27
典型的
0.27
Figure
0.26
Begin
0.25
కీల
0.25
Key
0.24
<start_of_image>
0.24
establishes
0.24
Throat
0.24
POSITIVE LOGITS
मेरी
0.32
𝗬
0.31
धन्यवाद
0.31
zięk
0.31
Спасибо
0.30
надеюсь
0.29
धन
0.29
Спасибо
0.29
спасибо
0.28
öyle
0.27
Activations Density 0.122%