INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     MainActivity
    -0.07
    awner
    -0.07
     quelque
    -0.06
    imports
    -0.06
    	swap
    -0.06
     jednou
    -0.06
    anto
    -0.06
    -0.06
     skins
    -0.06
     overwrite
    -0.06
    POSITIVE LOGITS
    (Be
    0.07
     Hamas
    0.07
     nitel
    0.07
    lenmiş
    0.06
     talented
    0.06
     BBC
    0.06
     neuron
    0.06
     laughter
    0.06
    放送
    0.06
    ند
    0.06
    Act Density 0.000%

    No Known Activations