INDEX
    Explanations

    possessive suffixes

    New Auto-Interp
    Negative Logits
    å¿ĥ
    -0.09
    人
    -0.09
    人æ°Ĺ
    -0.08
    ä¸ĢäºĽ
    -0.08
    大
    -0.07
    éĹ®é¢ĺ
    -0.07
    å°ı说
    -0.07
    人åijĺ
    -0.07
    æĥħ
    -0.07
    å£°éŁ³
    -0.07
    POSITIVE LOGITS
     own
    0.12
    ÂĢÂĻ
    0.09
     Own
    0.09
    own
    0.09
    ÂĢÂ
    0.08
    OWN
    0.08
    Own
    0.08
    _own
    0.08
    ÂĿ
    0.07
     latest
    0.07
    Act Density 0.089%

    No Known Activations