INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     πάν
    -0.08
     kurt
    -0.08
    -0.07
    协调
    -0.07
     تعمیر
    -0.07
     संग
    -0.07
    培训
    -0.07
    -0.07
     സംഘടിപ്പ
    -0.07
     ನೀಡಿದ್ದಾರೆ
    -0.07
    POSITIVE LOGITS
    nothing
    0.09
     humain
    0.08
     humanos
    0.08
     humana
    0.08
     মানব
    0.08
     Human
    0.08
    bron
    0.08
     manusia
    0.08
    human
    0.08
    idhe
    0.08
    Act Density 0.000%

    No Known Activations