INDEX
Negative Logits
ا
2.77
וה
2.42
อ่อน
2.28
ү
2.27
ла
2.20
ル
2.19
де
2.09
ه
2.09
ни
2.05
و
2.00
POSITIVE LOGITS
s
2.47
tedir
2.45
self
1.94
니다
1.94
raum
1.91
th
1.86
day
1.83
am
1.78
quy
1.77
im
1.76
Activations Density 0.003%
ا
וה
อ่อน
ү
ла
ル
де
ه
ни
و
s
tedir
self
니다
raum
th
day
am
quy
im