INDEX
Negative Logits
آل
-0.07
แนว
-0.07
pohod
-0.07
irl
-0.07
Cy
-0.07
Mort
-0.07
нед
-0.06
Por
-0.06
Met
-0.06
Carol
-0.06
POSITIVE LOGITS
당
0.06
reflecting
0.06
confirming
0.06
์ก
0.06
ש
0.06
-account
0.06
have
0.06
فرهنگی
0.06
reflected
0.06
посад
0.06
Activations Density 0.007%