INDEX
Negative Logits
er
1.33
र
1.18
AndTime
1.17
人
1.14
an
1.09
awcy
1.07
jumlah
1.07
latan
1.07
ahl
1.05
ové
1.04
POSITIVE LOGITS
contradiction
1.37
دن
1.33
আ
1.27
จํา
1.27
pessim
1.24
pessimistic
1.22
XOR
1.21
DMG
1.21
enclave
1.20
Hound
1.20
Activations Density 0.001%