INDEX
Negative Logits
regional
-0.08
Xt
-0.07
gl
-0.07
Guangdong
-0.07
Philippe
-0.07
lds
-0.07
sharp
-0.07
정도
-0.07
URAL
-0.07
لقى
-0.07
POSITIVE LOGITS
répond
0.08
chose
0.08
届
0.07
cedar
0.07
inement
0.07
com
0.07
Answers
0.07
bénéfici
0.07
meilleure
0.07
好き
0.07
Activations Density 0.006%