INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     plazo
    0.65
    Real
    0.57
     принимать
    0.53
     ईमानदारी
    0.52
    0.52
    रियल
    0.52
    нном
    0.51
    してくれる
    0.50
     rêve
    0.50
     Hace
    0.50
    POSITIVE LOGITS
     discusses
    0.74
    adium
    0.65
     refineries
    0.59
    ларын
    0.59
    icket
    0.59
    ENTE
    0.58
     discut
    0.58
     মানবাধিকার
    0.56
     comparison
    0.56
    まと
    0.56
    Act Density 0.003%

    No Known Activations