INDEX
Negative Logits
ج
1.26
지와
1.17
지
1.09
و
1.05
یم
1.02
ರ
1.02
marred
0.99
सँग
0.98
را
0.96
رب
0.95
POSITIVE LOGITS
er
1.27
is
1.02
r
1.00
ر
0.96
ール
0.93
した
0.91
ado
0.90
</strong>
0.90
र
0.89
ב
0.89
Activations Density 0.001%
ج
지와
지
و
یم
ರ
marred
सँग
را
رب
er
is
r
ر
ール
した
ado
</strong>
र
ב