INDEX
Negative Logits
ంట్
-0.09
ಂಟ್
-0.08
ولة
-0.08
ITES
-0.08
.activation
-0.08
(fc
-0.07
biases
-0.07
فر
-0.07
oxidation
-0.07
uaje
-0.07
POSITIVE LOGITS
orn
0.15
armed
0.13
rought
0.12
ORN
0.11
reat
0.11
orns
0.10
edded
0.10
orne
0.10
worn
0.09
axed
0.09
Activations Density 0.007%