INDEX
Negative Logits
中考
-0.07
-season
-0.07
ok
-0.07
Maybe
-0.07
wow
-0.07
insert
-0.07
tv
-0.07
宋
-0.06
couples
-0.06
高考
-0.06
POSITIVE LOGITS
DEFIN
0.07
プロジェクト
0.07
地处
0.07
0.07
_TYP
0.07
Ệ
0.07
0.07
בעלי
0.07
TÜRK
0.07
Conj
0.07
Activations Density 0.006%