INDEX
Negative Logits
φ
-0.08
$\
-0.07
independence
-0.07
Independence
-0.07
?
-0.07
aux
-0.07
independencia
-0.07
定位
-0.07
<$>
-0.07
ılık
-0.07
POSITIVE LOGITS
agal
0.08
umbersome
0.08
wanya
0.08
ുസ്ത
0.08
ございました
0.08
ласт
0.07
tampoco
0.07
Pais
0.07
Expense
0.07
Omni
0.07
Activations Density 0.146%