INDEX
Negative Logits
Wad
-0.08
hepat
-0.08
cakes
-0.08
ại
-0.08
Krä
-0.08
والخ
-0.08
grub
-0.07
Fuller
-0.07
铺
-0.07
Bag
-0.07
POSITIVE LOGITS
psilon
0.08
দক্ষ
0.08
bra
0.08
াপ
0.08
inh
0.07
تميز
0.07
্যাস
0.07
ILON
0.07
aling
0.07
্যান
0.07
Activations Density 0.014%