INDEX
Negative Logits
neut
-0.08
kf
-0.08
UIF
-0.08
shower
-0.08
breathe
-0.07
ef
-0.07
-0.07
Nemo
-0.07
baf
-0.07
exige
-0.07
POSITIVE LOGITS
olak
0.08
WA
0.08
WO
0.08
WI
0.08
_PO
0.07
Yong
0.07
Berl
0.07
Gal
0.07
Gal
0.07
हुन
0.07
Activations Density 0.784%