INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ól
    -0.06
    Neutral
    -0.06
    -face
    -0.06
     Kata
    -0.06
    Progress
    -0.06
    ари
    -0.06
    なかった
    -0.06
     Breakfast
    -0.06
    _stage
    -0.06
     heart
    -0.06
    POSITIVE LOGITS
     širo
    0.07
    论坛
    0.07
    .currentTimeMillis
    0.07
    ComputedStyle
    0.07
     finds
    0.07
     giveaway
    0.06
     lining
    0.06
     createState
    0.06
     مشتر
    0.06
    .Atoi
    0.06
    Act Density 0.007%

    No Known Activations