INDEX
Negative Logits
دارد
0.28
جسے
0.24
ബരി
0.24
داره
0.23
Indicates
0.22
ਹੈ
0.21
जिसे
0.21
indicates
0.21
article
0.21
ہے۔
0.21
POSITIVE LOGITS
themselves
0.35
தங்கள்
0.29
নিজেদের
0.26
ತಮ್ಮ
0.25
którzy
0.24
તેમના
0.24
ktorí
0.23
сами
0.23
ойношот
0.22
друг
0.22
Activations Density 0.308%