INDEX
Negative Logits
t
1.73
(
1.18
vý
1.05
ير
1.03
v
1.01
مت
0.99
hut
0.96
IE
0.94
tank
0.93
ent
0.93
POSITIVE LOGITS
น
1.53
ल
1.37
ف
1.33
ب
1.26
ন
1.19
ุ
1.16
you
1.11
ನ
1.11
คุณ
1.10
ıları
1.09
Activations Density 0.069%
t
(
vý
ير
v
مت
hut
IE
tank
ent
น
ल
ف
ب
ন
ุ
you
ನ
คุณ
ıları