INDEX
Negative Logits
ر
2.19
驒
1.99
deceiving
1.74
effectuées
1.70
férence
1.68
𝐚
1.63
tête
1.63
siniz
1.63
णिज्य
1.60
হ
1.59
POSITIVE LOGITS
ות
2.64
м
2.50
י
2.34
ی
2.33
й
2.23
таки
2.12
textField
2.11
мся
1.93
ة
1.93
ి
1.91
Activations Density 0.065%