INDEX
    Explanations

    owner's, others', peoples'

    New Auto-Interp
    Negative Logits
     insanlar
    0.49
     कंपनियां
    0.43
     kişiler
    0.43
     entities
    0.42
     beings
    0.42
     தன்னை
    0.41
    িলারা
    0.41
     लोग
    0.39
     নেতারা
    0.38
     महिलाएं
    0.36
    POSITIVE LOGITS
    别人的
    1.23
     peoples
    1.08
    用户的
    1.08
    学生的
    1.05
    大家的
    1.00
    者的
    0.96
    자의
    0.93
    者の
    0.91
    人的
    0.91
    ของผู้
    0.89
    Act Density 0.047%

    No Known Activations