INDEX
Negative Logits
िनी
-0.08
chased
-0.08
ört
-0.08
फैल
-0.07
mend
-0.07
xét
-0.07
વધુ
-0.07
arising
-0.07
依法
-0.07
ણી
-0.07
POSITIVE LOGITS
speaker
0.08
hablado
0.08
Español
0.08
indes
0.08
Desired
0.08
কথ
0.08
Conversations
0.07
�
0.07
parlare
0.07
ruso
0.07
Activations Density 0.000%