INDEX
Negative Logits
േ�
-0.08
bold
-0.08
ėj
-0.07
_help
-0.07
slam
-0.07
daring
-0.07
delayed
-0.07
ante
-0.07
fund
-0.06
جنب
-0.06
POSITIVE LOGITS
wee
0.09
Coment
0.08
haghaidh
0.08
methodological
0.08
arity
0.08
cabine
0.08
atok
0.08
隊
0.07
pas
0.07
రావ
0.07
Activations Density 0.011%