INDEX
Negative Logits
convict
-0.08
postal
-0.08
alerg
-0.08
radians
-0.08
Flood
-0.08
departments
-0.07
barang
-0.07
Spl
-0.07
SPL
-0.07
infection
-0.07
POSITIVE LOGITS
fosse
0.08
책
0.08
awkward
0.08
Dü
0.08
부족
0.08
발전
0.08
建设
0.08
기자
0.08
Excerpt
0.08
Hän
0.07
Activations Density 0.014%