INDEX
Negative Logits
bluff
-0.08
許
-0.07
_sun
-0.07
coordin
-0.06
academic
-0.06
gee
-0.06
黑龙
-0.06
hall
-0.06
越来越少
-0.06
诘
-0.06
POSITIVE LOGITS
Et
0.07
sortable
0.07
responsibly
0.07
("&0.07
播报
0.06
אהבתי
0.06
シリーズ
0.06
xn
0.06
характеристик
0.06
ериал
0.06
Activations Density 0.002%