INDEX
Negative Logits
EMP
-0.08
ಬೇ
-0.08
첫
-0.08
idz
-0.08
备注
-0.08
护理
-0.08
돌
-0.08
기타
-0.07
ertid
-0.07
�
-0.07
POSITIVE LOGITS
nover
0.08
wit
0.08
seguito
0.08
nt
0.07
ng
0.07
nop
0.07
னை
0.07
,所以
0.07
wg
0.07
american
0.07
Activations Density 0.184%