INDEX
Negative Logits
ികള്
1.12
been
1.02
đươ
0.96
ികൾ
0.94
/=
0.94
প্রেম
0.92
میتوان
0.90
uses
0.90
يكون
0.90
(\
0.89
POSITIVE LOGITS
cited
1.20
sputtered
1.11
reiterated
1.10
jokingly
1.09
idazole
1.05
explicó
1.04
bluntly
1.03
helplessness
1.01
<unused155>
1.00
िएगा
1.00
Activations Density 0.025%