INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     fokus
    -0.08
    agawa
    -0.07
    ag
    -0.07
     lust
    -0.07
    ivel
    -0.07
     Clap
    -0.07
     Maine
    -0.07
    -0.07
     -,
    -0.07
    Cre
    -0.07
    POSITIVE LOGITS
     adına
    0.08
     firsthand
    0.08
     الز
    0.08
     있을
    0.08
     یعنی
    0.08
     내려
    0.08
     từng
    0.08
     dune
    0.08
    ಕ್ಕಾಗಿ
    0.07
     rooted
    0.07
    Act Density 0.201%

    No Known Activations