INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     verzoek
    -0.08
    -0.08
     odnosno
    -0.08
     weg
    -0.08
     Frequency
    -0.08
    itness
    -0.07
    ACITY
    -0.07
     eyebrows
    -0.07
     એવું
    -0.07
    .fre
    -0.07
    POSITIVE LOGITS
     außerdem
    0.09
     또한
    0.09
    。また
    0.08
    agic
    0.08
     inoltre
    0.08
    Moreover
    0.08
    。而
    0.08
    ále
    0.07
    ,以及
    0.07
     Außerdem
    0.07
    Act Density 0.083%

    No Known Activations