INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     고개를
    -0.07
     đ�
    -0.06
     tant
    -0.06
    人民共和国
    -0.06
     Constant
    -0.06
    -0.06
     на
    -0.06
    vertiser
    -0.06
     TCHAR
    -0.06
     شاخ
    -0.06
    POSITIVE LOGITS
    Bio
    0.12
     Bio
    0.10
     bio
    0.09
     BIO
    0.07
     life
    0.07
     Bi
    0.06
     شکل
    0.06
    =list
    0.06
    bio
    0.06
     cameo
    0.06
    Act Density 0.003%

    No Known Activations