INDEX
Negative Logits
(Document
-0.08
stati
-0.07
ూడ
-0.07
ې
-0.07
_an
-0.07
。↵↵↵
-0.07
вари
-0.07
Psy
-0.07
euren
-0.07
試
-0.07
POSITIVE LOGITS
aro
0.08
ellipse
0.08
acquired
0.08
newfound
0.08
illed
0.07
ócr
0.07
Bic
0.07
年份
0.07
胆
0.07
463
0.07
Activations Density 0.159%