INDEX
Negative Logits
ный
1.37
螟
1.34
𝘵
1.30
ных
1.28
𝘥
1.23
τε
1.22
ﺕ
1.20
tedir
1.20
wykorzyst
1.18
ﺪ
1.18
POSITIVE LOGITS
er
1.39
i
1.36
stesse
1.16
ir
1.09
ro
1.05
ر
1.01
statistique
0.95
ли
0.92
locom
0.92
il
0.91
Activations Density 0.001%
ный
螟
𝘵
ных
𝘥
τε
ﺕ
tedir
wykorzyst
ﺪ
er
i
stesse
ir
ro
ر
statistique
ли
locom
il