INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    gzip
    -0.07
    ителя
    -0.07
    計算
    -0.06
     möchten
    -0.06
    4
    -0.06
    -0.06
    -0.06
     еж
    -0.06
    radius
    -0.06
     پیر
    -0.06
    POSITIVE LOGITS
    .flags
    0.08
     inactive
    0.08
    .post
    0.07
    Quote
    0.06
    Deposit
    0.06
    uffles
    0.06
     Sabb
    0.06
    .float
    0.06
    0.06
    .step
    0.06
    Act Density 0.123%

    No Known Activations