INDEX
    Explanations

    "I" followed by specific punctuation or words

    New Auto-Interp
    Negative Logits
    かもしれませんが
    0.47
    的一些
    0.45
     当然
    0.44
     oftentimes
    0.44
     perhaps
    0.42
     อาจ
    0.40
     azonban
    0.40
     tačiau
    0.40
    一些
    0.39
    虽然
    0.39
    POSITIVE LOGITS
     memakai
    0.44
     bruke
    0.40
     folos
    0.38
    は約
    0.37
     bruker
    0.36
     koriste
    0.36
     terdiri
    0.36
     lähe
    0.36
     நான்கு
    0.35
     त्यांना
    0.35
    Act Density 0.172%

    No Known Activations