INDEX
Negative Logits
Successfully
-0.08
一道
-0.08
들을
-0.08
们
-0.08
freshmen
-0.08
Antwort
-0.08
obituary
-0.07
slated
-0.07
vary
-0.07
anf
-0.07
POSITIVE LOGITS
tek
0.08
—they
0.08
दिव
0.08
correctness
0.08
—
0.08
puro
0.07
hi
0.07
ساز
0.07
交流
0.07
MEC
0.07
Activations Density 0.114%