INDEX
Negative Logits
ਆਪਣ
-0.08
ਜੋ
-0.08
ڪم
-0.08
হত
-0.08
Fremont
-0.08
taong
-0.08
دعا
-0.07
జ
-0.07
постеп
-0.07
someone
-0.07
POSITIVE LOGITS
(!)
0.09
)]
0.09
??
0.08
(?)
0.08
—not
0.08
incorrectly
0.08
ancis
0.08
wrongly
0.08
???↵↵
0.08
???
0.08
Activations Density 0.061%