INDEX
    Explanations

    Filipino language

    New Auto-Interp
    Negative Logits
    法国
    -0.13
     重庆
    -0.10
     فیلم
    -0.10
    贵州
    -0.10
    -0.09
    云南
    -0.09
    -0.09
     فرهنگ
    -0.09
    浙江
    -0.09
    农村
    -0.09
    POSITIVE LOGITS
     isang
    0.30
     maaaring
    0.29
     upang
    0.29
     mga
    0.29
     kailangan
    0.28
     tulad
    0.27
     iba't
    0.27
     dalawang
    0.27
     kapag
    0.27
     tungkol
    0.27
    Act Density 0.015%

    No Known Activations