INDEX
Negative Logits
дку
0.71
ঁ
0.69
ᚕ
0.63
unsurprisingly
0.62
ಟ್
0.60
ے
0.59
͜
0.59
टी
0.58
Komis
0.58
дят
0.57
POSITIVE LOGITS
et
0.87
ق
0.87
ل
0.85
in
0.79
شهر
0.79
ש
0.78
v
0.76
be
0.75
j
0.73
ن
0.71
Activations Density 0.008%
дку
ঁ
ᚕ
unsurprisingly
ಟ್
ے
͜
टी
Komis
дят
et
ق
ل
in
شهر
ש
v
be
j
ن