INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     ami
    -0.08
     forge
    -0.08
    -0.08
     moo
    -0.08
    -0.07
    AMI
    -0.07
    elastic
    -0.07
     אך
    -0.07
     Elastic
    -0.07
    ense
    -0.07
    POSITIVE LOGITS
    Нек
    0.08
     Than
    0.08
    ynchron
    0.07
    0.07
    ної
    0.07
     avg
    0.07
     veröffentlicht
    0.07
    kich
    0.07
    اس
    0.07
    "}↵
    0.06
    Act Density 0.742%

    No Known Activations