INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     piens
    1.13
    เพื่อน
    1.06
    കളും
    1.01
    +_
    0.97
    เนื้อ
    0.96
    버지
    0.96
    வரின்
    0.94
    เจ้า
    0.93
     ไฟล์
    0.93
     roommate
    0.93
    POSITIVE LOGITS
     if
    1.46
    If
    1.37
    if
    1.35
     если
    1.29
     when
    1.28
    如果是
    1.24
     If
    1.22
    When
    1.21
    when
    1.20
     for
    1.20
    Act Density 0.375%

    No Known Activations