INDEX
Negative Logits
modality
-0.08
imb
-0.08
IM
-0.08
suicide
-0.08
-modal
-0.07
(
-0.07
bekannten
-0.07
modal
-0.07
ร้อง
-0.07
Modal
-0.07
POSITIVE LOGITS
zabez
0.09
gewinnt
0.08
assuring
0.08
náz
0.08
forts
0.08
kuhakikisha
0.08
保障
0.08
衣
0.08
hust
0.08
ाफी
0.08
Activations Density 0.011%