INDEX
    Explanations
    No Explanations Found
    New Auto-Interp
    Negative Logits
     ultra
    -0.08
     Пол
    -0.07
    甲方
    -0.07
     TN
    -0.07
     proper
    -0.07
     Вы
    -0.07
    ixin
    -0.07
    -0.07
     Manitoba
    -0.07
    发行人
    -0.07
    POSITIVE LOGITS
    🔔
    0.08
    rientation
    0.07
    0.07
    ===============
    0.07
    //************************************************************************
    0.07
    ##
    0.07
    ////↵
    0.07
    //------------------------------------------------------------------------------------------------
    0.07
    0.07
    -------
    0.07
    Act Density 0.028%

    No Known Activations