INDEX
    Explanations

    transliterations and foreign words

    New Auto-Interp
    Negative Logits
    an
    0.37
    et
    0.35
    has
    0.33
    ंबी
    0.33
     نیز
    0.31
    0.31
     எளி
    0.30
    ло
    0.30
    यों
    0.30
    нным
    0.30
    POSITIVE LOGITS
    0.37
    0.36
    ッジ
    0.35
     آمریکا
    0.35
    0.32
    0.32
    ティ
    0.31
     américaine
    0.30
    チェ
    0.30
    メージ
    0.30
    Act Density 0.032%

    No Known Activations