INDEX
Negative Logits
בשנת
-0.08
/*↵
-0.07
颓
-0.06
!')↵
-0.06
/*----------------------------------------------------------------
-0.06
Matters
-0.06
beauty
-0.06
.nom
-0.06
.'_
-0.06
/Game
-0.06
POSITIVE LOGITS
easier
0.07
_processed
0.06
好友
0.06
这里的
0.06
worked
0.06
pożycz
0.06
溵
0.06
籴
0.06
resolved
0.06
Erf
0.06
Activations Density 0.000%