INDEX
    Explanations

    is followed by a definition

    New Auto-Interp
    Negative Logits
    によっては
    0.61
    Didn
    0.58
     Didn
    0.44
     Neither
    0.44
    もない
    0.43
    beros
    0.41
     በፊት
    0.40
    してた
    0.39
     দেয়নি
    0.39
     Gibt
    0.39
    POSITIVE LOGITS
    是最
    1.66
     является
    1.47
    才是
    1.30
     merupakan
    1.29
     είναι
    1.28
     являются
    1.24
     adalah
    1.13
    是我
    1.13
     is
    1.13
    是我们
    1.10
    Act Density 0.100%

    No Known Activations