INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     mismo
    0.53
     también
    0.52
     estén
    0.49
     myös
    0.48
     misma
    0.47
     oy
    0.46
     inflection
    0.46
     també
    0.46
    oksatta
    0.46
     również
    0.45
    POSITIVE LOGITS
    a
    0.55
    s
    0.53
    0.52
    L
    0.50
    Is
    0.48
    лич
    0.47
    matched
    0.46
    o
    0.45
     coll
    0.45
    ld
    0.44
    Act Density 0.000%

    No Known Activations