INDEX
Negative Logits
ના
1.32
are
1.14
ﺲ
1.05
болезнь
0.98
㶲
0.97
ς
0.95
き
0.95
ला
0.93
یاء
0.93
ामध्ये
0.92
POSITIVE LOGITS
0
1.70
า
1.53
0
1.35
écriv
1.21
}$
1.20
that
1.16
ור
1.16
to
1.16
↵
1.13
ip
1.12
Activations Density 0.027%
ના
are
ﺲ
болезнь
㶲
ς
き
ला
یاء
ामध्ये
0
า
0
écriv
}$
that
ור
to
↵
ip