INDEX
Negative Logits
a
1.32
r
1.05
l
1.03
ל
1.00
itley
0.99
ll
0.95
Eats
0.91
lcii
0.89
Hons
0.89
sh
0.89
POSITIVE LOGITS
ك
1.34
ہر
1.09
呿
1.05
淒
1.00
akhir
0.98
㽛
0.97
哃
0.96
㳖
0.96
،
0.96
метою
0.95
Activations Density 0.000%
a
r
l
ל
itley
ll
Eats
lcii
Hons
sh
ك
ہر
呿
淒
akhir
㽛
哃
㳖
،
метою