INDEX
Negative Logits
如果
0.29
নিজেকে
0.29
与
0.26
de
0.25
자신의
0.25
ตัวเอง
0.25
len
0.25
Contains
0.25
与
0.24
৫৫
0.24
POSITIVE LOGITS
juntos
0.46
جميعا
0.43
gemeinsamen
0.34
saling
0.33
모두
0.33
birbir
0.32
collectively
0.31
gemeinsam
0.31
都很
0.30
elkaar
0.30
Activations Density 0.100%