INDEX
Negative Logits
=random
-0.09
craz
-0.09
ذف
-0.08
ıştır
-0.08
Hof
-0.08
dä
-0.08
inwest
-0.08
്യാസ
-0.08
压
-0.08
odnos
-0.07
POSITIVE LOGITS
victimes
0.10
受付
0.10
grieving
0.10
victims
0.09
denunciar
0.09
testimon
0.09
denuncia
0.09
etection
0.09
救
0.09
vítimas
0.09
Activations Density 0.027%