INDEX
    Explanations

    "feder revolutionized bath"

    New Auto-Interp
    Negative Logits
    𝐬
    0.79
    ς
    0.76
    ség
    0.70
    s
    0.70
    𝘀
    0.68
    THING
    0.61
    𝐭
    0.61
    ことが多い
    0.59
    ات
    0.58
    ों
    0.55
    POSITIVE LOGITS
    কে
    0.70
    an
    0.66
    0.59
    ور
    0.58
    ーション
    0.55
    zelfde
    0.55
    ри
    0.54
    р
    0.53
    0.52
    ра
    0.51
    Act Density 1.135%

    No Known Activations