INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    Opinion
    -0.08
     अर्थात
    -0.08
     Sang
    -0.07
     गृह
    -0.07
    uket
    -0.07
    agine
    -0.07
    -0.07
     пыт
    -0.07
    ीय
    -0.07
     жа
    -0.07
    POSITIVE LOGITS
     feats
    0.10
     feat
    0.09
    做到
    0.09
    不错
    0.09
     logró
    0.08
     glimpse
    0.08
     اج
    0.08
     consegue
    0.08
     logra
    0.08
     erzielt
    0.07
    Act Density 0.020%

    No Known Activations