INDEX
Negative Logits
जिसे
-0.10
who's
-0.09
തന്റെ
-0.09
ತನ್ನ
-0.09
ਜਿਸ
-0.09
हूँ
-0.09
ਹੈ
-0.09
kiu
-0.08
الذي
-0.08
ఉంద
-0.08
POSITIVE LOGITS
themselves
0.17
-elles
0.13
-ils
0.12
आहेत
0.12
নিজেদের
0.11
ಿವೆ
0.11
которые
0.11
joissa
0.11
أنفس
0.11
जिन्हें
0.11
Activations Density 1.312%