INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     contagious
    -0.08
     mindset
    -0.07
    นี้
    -0.07
    ธุ
    -0.07
    घर
    -0.07
     puntual
    -0.07
    -0.07
     retros
    -0.07
    เงิน
    -0.07
     phát
    -0.07
    POSITIVE LOGITS
     Stras
    0.09
    uchar
    0.09
     toegankelijk
    0.09
     Dun
    0.08
     במיוחד
    0.08
     Arabic
    0.08
    acyj
    0.08
     evacuated
    0.08
    atex
    0.08
    穿
    0.08
    Act Density 0.007%

    No Known Activations