INDEX
Negative Logits
jeugd
-0.09
undone
-0.08
controlled
-0.08
controlled
-0.08
juventud
-0.07
-0.07
молодеж
-0.07
escolhas
-0.07
afuera
-0.07
heng
-0.07
POSITIVE LOGITS
rost
0.09
شخصیت
0.08
Names
0.08
Enfin
0.08
یاد
0.08
0.08
Recognition
0.08
기억
0.08
않는
0.07
preferential
0.07
Activations Density 0.007%