INDEX
Negative Logits
sử
0.39
используется
0.38
использовании
0.38
เนื่อง
0.38
relies
0.37
භාවිතා
0.37
demonstrates
0.37
ursing
0.37
ဖြစ်သည်။
0.36
бути
0.36
POSITIVE LOGITS
導致
0.69
disrupt
0.66
disrupting
0.65
disrupts
0.64
باعث
0.63
disruptions
0.62
disruption
0.61
导致
0.61
disrupted
0.61
разру
0.59
Activations Density 0.191%