INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    _land
    -0.07
    _light
    -0.06
     μπο
    -0.06
     ****************************************
    -0.06
    вет
    -0.06
     weil
    -0.06
    -hard
    -0.06
     victims
    -0.06
     possessions
    -0.06
     così
    -0.06
    POSITIVE LOGITS
    arr
    0.07
    انیا
    0.07
    _manage
    0.06
     arr
    0.06
    Continue
    0.06
     آینده
    0.06
     esp
    0.06
    Num
    0.06
    0.06
    τερα
    0.06
    Act Density 0.000%

    No Known Activations