INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    gebiet
    0.66
    seva
    0.63
    ген
    0.62
    derdag
    0.62
    Since
    0.60
    agons
    0.59
    entrum
    0.58
    Biographie
    0.58
    נים
    0.57
    Along
    0.57
    POSITIVE LOGITS
     এমন
    0.52
     ik
    0.52
     je
    0.50
     dur
    0.50
     όσο
    0.49
     kun
    0.48
     পারেন
    0.48
     μια
    0.47
     어떤
    0.46
     당신
    0.45
    Act Density 0.002%

    No Known Activations