INDEX
Negative Logits
pro
-0.09
reat
-0.08
Pro
-0.08
gras
-0.08
пр
-0.08
Pro
-0.08
biom
-0.07
Activator
-0.07
Quest
-0.07
302
-0.07
POSITIVE LOGITS
punishment
0.08
Komment
0.08
sustain
0.07
து
0.07
sustained
0.07
ത്
0.07
fino
0.07
ike
0.07
tolerated
0.07
subtraction
0.07
Activations Density 0.003%