INDEX
Negative Logits
ترین
-0.06
sales
-0.06
<Car
-0.06
難
-0.06
FOX
-0.06
показ
-0.06
rằng
-0.06
POS
-0.06
nas
-0.06
Jin
-0.06
POSITIVE LOGITS
を
0.14
를
0.12
을
0.11
を
0.11
」を
0.10
)를
0.10
자를
0.10
위를
0.10
ことを
0.09
식을
0.09
Activations Density 0.018%
ترین
sales
<Car
難
FOX
показ
rằng
POS
nas
Jin
を
를
을
を
」を
)를
자를
위를
ことを
식을