INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     miel
    -0.09
     couches
    -0.08
     ál
    -0.08
     রাত
    -0.07
    095
    -0.07
     eitthvað
    -0.07
     alumni
    -0.07
     danış
    -0.07
     sofa
    -0.07
     slimming
    -0.07
    POSITIVE LOGITS
    }{
    0.09
    ,所以
    0.08
    0.07
     Vern
    0.07
    0.07
     initi
    0.07
     prepre
    0.07
    ,但是
    0.07
    ,因为
    0.07
    0.07
    Act Density 0.038%

    No Known Activations