INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -0.07
    throp
    -0.07
     binder
    -0.07
    Ro
    -0.07
     Kre
    -0.07
     cpu
    -0.07
     tree
    -0.07
     II
    -0.07
    üsü
    -0.06
    το
    -0.06
    POSITIVE LOGITS
     demand
    0.18
     Demand
    0.15
    -demand
    0.14
    demand
    0.14
     demands
    0.13
    Demand
    0.11
     demanding
    0.10
     demanded
    0.10
     demande
    0.09
     DEM
    0.09
    Act Density 0.013%

    No Known Activations