INDEX
    Explanations

    subjects that are capable

    New Auto-Interp
    Negative Logits
    しており
    0.41
    されて
    0.40
    くと
    0.38
     रहेको
    0.38
    0.38
     δημ
    0.38
    されていた
    0.37
    しまった
    0.37
     تجي
    0.37
    んでいた
    0.37
    POSITIVE LOGITS
     capable
    1.54
     capaz
    1.36
     capaces
    1.30
     capazes
    1.28
     capables
    1.27
    capable
    1.26
     capace
    1.20
     suited
    1.10
     tailored
    1.07
     able
    1.06
    Act Density 0.047%

    No Known Activations