INDEX
    Explanations

    explicit sexual content or scripts

    New Auto-Interp
    Negative Logits
     อาจ
    0.51
    อาจ
    0.50
     возможность
    0.48
     можливість
    0.48
     অনুসরণ
    0.47
     niektórych
    0.47
     відкри
    0.47
     अनुसरण
    0.47
    0.44
     कठोर
    0.44
    POSITIVE LOGITS
    ار
    0.45
     О
    0.44
    0.41
    ير
    0.41
    ബരിമല
    0.40
    0.40
    0.40
    О
    0.39
    кономи
    0.38
    تو
    0.38
    Act Density 0.001%

    No Known Activations