INDEX
Negative Logits
身份
0.26
StarGo
0.25
တဲ့
0.24
عدالت
0.24
Spaß
0.23
nerdy
0.23
들을
0.23
ارهای
0.23
ज्यादा
0.23
cái
0.22
POSITIVE LOGITS
ce
0.30
th
0.27
er
0.26
dr
0.26
ol
0.26
ě
0.25
á
0.25
se
0.24
re
0.24
ten
0.24
Activations Density 0.119%
身份
StarGo
တဲ့
عدالت
Spaß
nerdy
들을
ارهای
ज्यादा
cái
ce
th
er
dr
ol
ě
á
se
re
ten