INDEX
    Explanations

    the particle "で," indicating locations or means in sentences

    New Auto-Interp
    Negative Logits
     "];
    -0.70
     يتيمه
    -0.68
     Holtz
    -0.64
    什么呢
    -0.62
    見えない
    -0.62
    見えます
    -0.61
    Datuak
    -0.60
     iſt
    -0.60
    はこんな感じ
    -0.57
    ſhip
    -0.57
    POSITIVE LOGITS
    3.51
     で
    2.36
    でお
    1.73
    で大
    1.71
    りで
    1.68
    でも
    1.63
    では
    1.62
    などで
    1.61
    にて
    1.53
    での
    1.50
    Act Density 0.015%

    No Known Activations