INDEX
Negative Logits
𝟬
0.24
allong
0.23
wszyst
0.23
ทั้ง
0.23
nejen
0.23
tất
0.22
także
0.22
đây
0.22
этих
0.22
这两个
0.22
POSITIVE LOGITS
ignal
0.34
ients
0.29
lege
0.26
a
0.25
vida
0.25
ga
0.25
ap
0.25
alternatively
0.23
agen
0.23
atorio
0.23
Activations Density 0.500%