INDEX
    Explanations

    Okay, initiating explanation

    New Auto-Interp
    Negative Logits
    omegranate
    0.32
     restitution
    0.30
    ad
    0.29
     หัด
    0.29
     réflexion
    0.28
     वारदात
    0.27
     Matthe
    0.27
     antipsych
    0.26
    athed
    0.26
     Berlusconi
    0.26
    POSITIVE LOGITS
     본격
    0.30
     iniziamo
    0.29
    全面的
    0.29
     extensively
    0.28
    ٹو
    0.28
     поговорим
    0.28
    .`
    0.27
     कंडी
    0.27
    全面
    0.27
     பல்வேறு
    0.27
    Act Density 0.583%

    No Known Activations