INDEX
Negative Logits
Yam
-0.08
ఆ
-0.08
Yu
-0.08
stab
-0.08
ਆ
-0.07
Essex
-0.07
య్య
-0.07
sure
-0.07
יא
-0.07
asted
-0.07
POSITIVE LOGITS
fully
0.10
biệt
0.08
byl
0.08
hafte
0.08
liest
0.08
리에
0.08
chiếc
0.08
ोद
0.08
compartment
0.07
codes
0.07
Activations Density 0.010%