INDEX
Negative Logits
anter
-0.06
_m
-0.06
US
-0.06
Gram
-0.06
ará
-0.06
۲۸
-0.06
дод
-0.06
EUR
-0.06
má
-0.06
-foot
-0.06
POSITIVE LOGITS
wij
0.07
),"
0.06
queens
0.06
中
0.06
식
0.06
fronts
0.06
prison
0.06
ker
0.06
wife
0.06
�
0.06
Activations Density 0.003%