INDEX
    Explanations

    the Japanese particle "と" indicating connections or relationships

    New Auto-Interp
    Negative Logits
    思います
    -0.63
    事です
    -0.63
    WriteBarrier
    -0.59
    気がします
    -0.56
    思った
    -0.54
    ことはありません
    -0.50
    のかもしれません
    -0.49
    ことです
    -0.48
    くれない
    -0.48
     angela
    -0.48
    POSITIVE LOGITS
    2.71
     と
    1.75
    りと
    1.47
    1.46
    1.43
    とお
    1.39
    ーと
    1.34
    いと
    1.27
    とも
    1.21
    との
    1.16
    Act Density 0.028%

    No Known Activations