INDEX
Negative Logits
eers
1.09
𝙩
1.09
ت
1.06
頃
1.04
tellers
1.02
eek
0.97
ein
0.96
0.95
ی
0.94
𝙨
0.94
POSITIVE LOGITS
icans
1.16
msup
0.88
grin
0.88
ப்ளாக்
0.87
鮒
0.86
ंटर
0.83
دریا
0.82
Bankruptcy
0.81
ومرحبا
0.81
Asians
0.80
Activations Density 0.105%