INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    Subtitle
    -0.07
     Vic
    -0.07
    ROID
    -0.07
     passiert
    -0.07
    iende
    -0.07
    -ci
    -0.07
     pits
    -0.07
     खत्म
    -0.07
    DEM
    -0.07
     nominal
    -0.07
    POSITIVE LOGITS
     empat
    0.09
     empath
    0.09
    姓名
    0.09
    是谁
    0.09
     кого
    0.09
     sympath
    0.09
    那里
    0.08
    :innen
    0.08
    에게
    0.08
     whom
    0.08
    Act Density 0.035%

    No Known Activations