INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    горит
    -0.08
    有限
    -0.08
     Pleasant
    -0.08
    Amber
    -0.07
     "",
    ↵
    -0.07
     alb
    -0.07
     použív
    -0.07
     αυτό
    -0.07
    ooda
    -0.07
    Vip
    -0.07
    POSITIVE LOGITS
    +k
    0.07
     ähnlich
    0.07
    .TH
    0.07
    Gest
    0.07
    Der
    0.07
    (total
    0.07
    _DEVICE
    0.07
    kompet
    0.07
    (th
    0.07
    _COMP
    0.07
    Act Density 0.000%

    No Known Activations