INDEX
Explanations
bibliographic citations
currency symbols and numbers
New Auto-Interp
Negative Logits
ח
0.51
ام
0.51
는
0.49
من
0.48
ال
0.46
نا
0.46
は
0.45
מ
0.45
ک
0.44
in
0.44
POSITIVE LOGITS
et
0.57
aar
0.46
वर्ती
0.46
.
0.45
elje
0.45
etse
0.44
krank
0.43
tué
0.42
a
0.41
هام
0.40
Activations Density 0.175%