INDEX
    Explanations

    stark, dunkel, oder aktuell

    New Auto-Interp
    Negative Logits
     celui
    0.96
     нужен
    0.86
     который
    0.83
     કરવો
    0.78
     ہوگئی
    0.77
     કર્યો
    0.76
     який
    0.75
     должен
    0.72
     variously
    0.72
     होनी
    0.71
    POSITIVE LOGITS
    elige
    1.45
    ändige
    1.45
    endige
    1.43
     большие
    1.35
    rlige
    1.33
    chende
    1.29
     spezielle
    1.29
     interessante
    1.28
    ционные
    1.28
    äische
    1.28
    Act Density 0.025%

    No Known Activations