INDEX
Negative Logits
ाई
1.45
客様
1.45
وهذه
1.44
ca
1.41
esist
1.38
socializing
1.38
대해
1.37
ﺐ
1.37
>−</
1.36
𝚐
1.34
POSITIVE LOGITS
ل
1.80
न
1.75
ان
1.70
น
1.70
นี่
1.61
на
1.47
ן
1.46
л
1.45
त
1.41
ن
1.39
Activations Density 0.065%
ाई
客様
وهذه
ca
esist
socializing
대해
ﺐ
>−</
𝚐
ل
न
ان
น
นี่
на
ן
л
त
ن