INDEX
Negative Logits
ทำให้
0.33
กำหนด
0.32
దాని
0.32
Länge
0.31
}
0.30
สำหรับ
0.30
embedding
0.30
строку
0.30
छापा
0.30
നിങ്ങൾ
0.30
POSITIVE LOGITS
themselves
0.55
voluntarily
0.40
নিজেদের
0.39
complained
0.39
leurs
0.38
participar
0.38
অধিকাংশই
0.38
their
0.38
loro
0.38
unwilling
0.37
Activations Density 0.331%