INDEX
    Explanations

    Network configuration

    New Auto-Interp
    Negative Logits
    -0.09
     😂
    -0.09
     stopwatch
    -0.08
     humor
    -0.08
     forb
    -0.08
     YY
    -0.08
     हास
    -0.08
     bucks
    -0.08
     souvenir
    -0.08
     joking
    -0.08
    POSITIVE LOGITS
     eenvoudig
    0.09
     simplicité
    0.08
    Simple
    0.08
     généralement
    0.08
     Labour
    0.08
     manually
    0.08
     información
    0.08
    [↵
    0.08
    Configure
    0.08
    _simple
    0.08
    Act Density 0.010%

    No Known Activations