INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Platinum
    -0.06
    <Course
    -0.06
     Verb
    -0.06
     objections
    -0.06
    .deg
    -0.06
     dmg
    -0.06
     Zimmer
    -0.06
     ALS
    -0.06
     ціка
    -0.06
     eligible
    -0.06
    POSITIVE LOGITS
    $this
    0.07
     recreation
    0.07
     sle
    0.07
     celebr
    0.07
    sns
    0.07
    νομ
    0.06
    сих
    0.06
    THIS
    0.06
     jméno
    0.06
    _descriptor
    0.06
    Act Density 0.029%

    No Known Activations