INDEX
Negative Logits
مي
0.44
Ꮦ
0.42
ת
0.42
previs
0.41
лна
0.40
流域
0.39
رجع
0.39
ము
0.38
ಮಾಣ
0.38
퇸
0.38
POSITIVE LOGITS
ot
0.57
a
0.56
ad
0.55
ut
0.54
and
0.54
ir
0.53
il
0.53
ant
0.52
ams
0.49
ert
0.48
Activations Density 0.005%
مي
Ꮦ
ת
previs
лна
流域
رجع
ము
ಮಾಣ
퇸
ot
a
ad
ut
and
ir
il
ant
ams
ert